Neo4j というグラフ DB を触ってみたくて読んだ。 Cypher は最初かなり使いづらいが、そのうち慣れてくるだろうと思って書いていた。後半ではメタデータ管理やパターン検知、セマンティック検索など、様々なドメインでの知識グラフの活用例も解説されていた。
要するに色々な要素技術はあるのだが、最初にして最大の問題はその設計にあると感じた。僕自身、普段からサイエンスからビジネスに至るまで幅広いデータを扱っているが、とりわけ人文系の情報は構造化そのものが難しい。 LLM の登場で処理しやすくなってきているとはいえ、やはり信頼性の高い出力を得るためには、知識グラフなどの体系化されたデータ構造が必須であると考えている。
その意味では、もう少し上流の考え方を知ることも極めて重要であると思った。もちろん Neo4j や Cypher は便利だし、この本もとても役に立ったのだが、設計思想を理解していないとこれらを扱うのもかなり難しいだろう。実際に僕もわかっていないので、その部分は継続して学習する必要がありそうだ。