LegalOn Technologies Engineering Blog

LegalOn Technologies 開発チームによるブログです。

情報科学若手の会で発表してきました

LegalOn Technologiesで検索・推薦エンジニアをやっております宮里(smiyazato)です。 9/14-9/16の三連休に軽井沢で開催された情報科学若手の会で、スポンサーとして発表してきたのでその報告を致します。

情報科学若手の会とは

情報処理学会のプログラミングシンポジウム委員会が主催している合宿形式のイベントで、年1回あります。57回目なのでそのくらいの歴史があるらしいです。

若手の会と名がついていますが年齢制限とかはなく、参加者40名前後の中で、新卒4年目27歳の私が大体上位5分の1ラインくらいに見えました(勝手な肌感)。

合宿の中では、情報科学に関連する発表がいくつか行われ、発表外でも親睦を深めるイベントがあります。分野の縛りは多分あまりなく、基本的にカジュアルかつ内容が濃い雰囲気です。

そして

画像の通り、参加後にブログを書く、そういう伝統があります。

スピード感と熱量を重視して、このブログもカジュアルな雰囲気で報告していきます。

発表したこと

スライドは公開しています

speakerdeck.com

コンセプトは軽めの分野紹介で、法務の仕事を検索・推薦技術で楽にするとはどういうことか、といった話をしました。つまりは自分のチームでやっていることのまとめです。この1年くらいでやってきた新しい内容を盛り込んでいます。

参加・発表しようとした背景

私は6年前(2018年)の参加者で、大体の雰囲気だけは知っておりました。

この会の特徴として以下のものがあるとは思っていました。

  • 質問・交流時間が実質無制限(合宿形式であり、枠外で雑談出来る時間が膨大にあるので)
  • 幅広い分野の人が集まる。分野的に少数派になってしまっても、こういう面白い分野があります系の発表がちゃんとウケる
  • それでいて、深い発表をして良く、深い質問が返ってくる

一方で、検索・推薦エンジニアとしてチームで扱っている内容は以下の特徴・課題がありました。

  • 最近の検索・推薦技術の進化(大規模言語モデルやRetrieval-Augmented Generationなど)によって活気が出てきて、やること・やれることが増えている
  • しかしながら、ニッチな要望を満たす仕事で、独自の進化をしているため、やっていることにイメージを持ってもらうのが難しい
  • 詳細な技術の紹介をしても良いが、まず分野自体の面白さを啓蒙する必要がありそう

情報科学若手の会でこの分野の紹介をやるのは相性が良さそうで、是非ともいずれやりたいとは思っていました。今年この時期に運よく、開発スケジュールの余裕が出来ていたこともあり、自ら会社と相談してスポンサーをさせて頂きました。ご協力頂いた会社のメンバー、若手の会幹事の皆様に感謝です。

発表の感触

  • 今年は自然言語処理専門の人は少なめではあったのですが(インフラ系や低レイヤ系やプログラミング言語理論系の人が多かった印象)、他分野の方からもたくさん反応や質問を頂けました。
  • 契約書や法律の文章の特色に対する反応が多かったです。つまりは、自然言語的な曖昧さ・形式的にフォーマットが固まっている部分が両方ある、という面白さ・難しさに興味を持って頂けたようでした。
  • 技術を乱用せずにどう制約をつけていくか、という質問も多くありました。
    • どうやって法制度に配慮しながらプロダクトを作っているのか
      • リーガルテックのスタートアップ複数で「AI・契約レビューテクノロジー協会(ACORTA)」という組織を作り、政府・行政と対話しながら、法制度の範囲内で技術活用するように調整している、といった話を紹介しました。
    • 大規模言語モデルのハルシネーションが致命的にならないようにどうするか
      • 入力の形式にあえて制約をつけることによって、一種の情報抽出として大規模言語モデルを扱うことが出来て、出力を制御出来る、といった話をしました。
  • 機能によってprecision/recallのどちらを優先するかが違いそう、という鋭いコメントを頂けました(その通り)。どう評価してどう改善するかという話題が盛り上がりました。

他の発表

全部印象的だったのですが、2例紹介します。

1. 係り受け解析を用いた法律文書中の略称規定の解析についての報告

speakerdeck.com

  • シンプルに、問題意識(法令文章の解釈をサポート)が我々と凄く近いですね。新しい技術であるほど適している訳ではないという肌感、評価自体に専門家が欲しいという課題はとても共感出来ました。

2. まず「言語」から始めるソフトウェア開発

drive.google.com

  • TypedCFGという発想(DSLの文法設定の不整合を型である程度弾く)は結構目から鱗でした。言われてみれば素直なアイデアで、綺麗な理論がありそうだとは思いました。

その他の会の雰囲気

  • 合宿所はこういう自然に囲まれています。宿泊している部屋の窓からもこういう森が見えます。

  • QRコードを汚していくゲームで、適当な戦略を喋っていたらいつのまにか自分のチームが3位になってドライフルーツ(信州産りんご)をゲット出来ました。

まとめ

  • 研究発表会とも会社間の交流とも少し違っていて、会社員を交えた上での「大学そのもの」っぽい雰囲気が味わえました。隣の分野が何をしているのか覗き見出来て、未来像を語り合える感じです。これは働き始めてからだと割と貴重なものだなとは思いました。
  • リーガルテック×検索推薦 に親しみを持ってもらうという当初の目的は果たせて大成功だったと個人的には思っています。これからも、弊チームの世界観の発信を頑張りたいです。
メンバー募集中!!

株式会社LegalOn Technologies では、検索エンジニアやMLエンジニアなど、複数のポジションでエンジニアを募集しています。気軽にご応募ください。

herp.careers