こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。
LegalForce Researchでは現在、高速なパターンマッチングマシン Daachorse(ダークホース)を開発・運用しています。文字列処理の基礎である複数パターン検索を提供するRust製ライブラリです。以下のレポジトリで公開されています。
本記事はDaachorseの技術仕様を解説します。具体的には、
- 複数パターン検索に関係する基礎技術(トライ木・Aho–Corasick法・ダブル配列)
- Daachorseの実装の工夫と性能
を解説します。
以下のような方を読者として想定します。
続きを読む