こんにちは、LegalOn Technologiesでエンジニアをしている神田(@kampersanda)です。
本記事では、Jaccard係数に基づく類似文書検索の高速化技法を解説し、契約書検索での実験結果を報告します。
続きを読むこんにちは、LegalOn Technologiesでエンジニアをしている神田(@kampersanda)です。
本記事では、Jaccard係数に基づく類似文書検索の高速化技法を解説し、契約書検索での実験結果を報告します。
続きを読むこんにちは!LegalOn Technologiesのソフトウェアエンジニア、渡辺です。
2024年2月15日から16日にかけて開催された"Developers Summit 2024"(以下、デブサミ)に参加し、「生成AIを搭載したプロダクト開発~少人数で爆速リリースしてわかったこと~」というテーマで発表しました。
今回は、発表までの過程、スケジュール、発表内容、そして発表後の感想について書かせていただきます。
続きを読むこんにちは。株式会社LegalOn Technologies でエンジニアをしております、勝田(@WinField95)です。この記事は、情報検索・検索技術 Advent Calendar 2023 の 20日目の記事として執筆されました。
この記事では、ANTLR[1]を使用したシンプルなクエリ構文の解析を行う検索クエリパーサーの生成と、解析結果から Elasticsearch の Query DSL[2]への変換までのプロセスと簡単な実装を紹介します。実務では、要求に応じて複雑なクエリ構文の文法定義が必要になる場合もありますが、この記事ではなるべく簡単なクエリ構文を取り扱います。解説で使用するコードは、この GitHub のリポジトリで公開しますので、参考にしてみてください。また、Search Engineering Tech Talk 2023 Winter では、この記事の内容をもとに発表を行いました。ぜひスライドもご覧ください。
続きを読むこんにちは。株式会社LegalOn Technologies で品質保証(QA)エンジニアをしております、リンです。
2021年にLegalOn Technologiesでキャリアをスタートしました。入社当時、QAチームはたった3人で、品質保証プロセスもまだ発展途上でした。時間が経つにつれ、会社は急速に成長し、現在では、QAエンジニアの数も19人に増えています。組織が成長すると共に、最も効果的な品質保証プロセスを見つけるための探求は続いています。
この記事では、その過程で取り入れた新しい取り組みについて説明します。
続きを読むこんにちは、LegalOn Technologies Researchで研究員をしている神田(@kampersanda)です。
弊社では、検索チーム主催でセマンティック検索とベクトル検索に関する社内勉強会を定期的に実施しています。この勉強会では、技術に関心のあるエンジニアが有志で議題を持ち寄り、知識共有を行っています。
その成果のひとつとして、文埋め込み技術であるSimCSEのチュートリアル資料を作成し、以下に公開しました。
この資料はNotebookとして作成されており、SimCSEの学習から評価までの一連の動作を簡単に試して頂くことができます。また、コードの各パートには詳細なコメントや引用を付与しています。
本記事では、資料作成の目的や方法などを簡単に紹介します。チュートリアルの内容については、Notebookをご参照ください。
続きを読むこんにちは、LegalOn Technologies 検索チームの志水です。
2023/10/27と28に開催された PyCon APAC 2023 に参加したので、そのレポートをお送りします。
2日間あるイベントのうち、初日は私によるレポート、2日目はチームリーダーの打田によるレポートをお届けします。
続きを読む