LegalOn Technologies Engineering Blog

LegalOn Technologies 開発チームによるブログです。

2024-01-01から1年間の記事一覧

Lucene/Elasticsearch の Character Filter でユニコード正規化するとトークンのオフセットがズレるバグへの Workaround

pre.code{ white-space: pre; overflow-x: scroll; } こんにちは、LegalOn Technologiesでエンジニアをしている神田(@kampersanda)です。 この記事の内容 Elasticsearch の Character Filter でユニコード正規化を適用したとき、Tokenizer の結果によって…

ネットワーク分析を用いた文書参照関係の分析

はじめに 株式会社LegalOn Technologies でデータアナリストをしている高木 要です。LegalOn Technologiesではデータ分析業務に積極的に取り組んでおり、我々データアナリストチームは各部門のステークホルダーとともに製品やビジネスの価値をデータから評価…

Jaccard係数に基づく類似文書検索の高速化技法

こんにちは、LegalOn Technologiesでエンジニアをしている神田(@kampersanda)です。 本記事では、Jaccard係数に基づく類似文書検索の高速化技法を解説し、契約書検索での実験結果を報告します。

「生成 AI を搭載したプロダクト開発」というタイトルでデブサミ2024に登壇しました!

こんにちは!LegalOn Technologiesのソフトウェアエンジニア、渡辺です。 2024年2月15日から16日にかけて開催された"Developers Summit 2024"(以下、デブサミ)に参加し、「生成AIを搭載したプロダクト開発~少人数で爆速リリースしてわかったこと~」とい…

4年ぶりの開催!検索技術勉強会 - 2023 - イベントレポート&インタビュー

こんにちは、LegalOn Technologiesにてエンジニアリング推進グループに所属の荒木と申します。 2023年12月20日、弊社オフィスにて「検索技術勉強会(以降 勉強会)」が開催されました。 この勉強会の内容と「なぜオフライン勉強会を再開したのか」について、弊…