Dev.to3d ago1 min read

Evaluating Legal Reasoning Traces with Legal Issue Tree Rubrics

選定理由 Paper: https://arxiv.org/abs/2512.01020 Code: N/A 概要(データセット論文) 【社会課題】法的推論タスクにおける信頼性評価において、最終的な判決の正誤だけを見ていては不十分。途中の推論プロセスの妥当性を測る手段が必要。【データの設計と従来技術の限界】裁判所判決文を Issue Tree（法的論点ツリー）に変換し、葉ノードに対しルーブリック基準を適用可能にした。原告・被告・裁判所の主張をツリー構造で整理した約24,000インスタンスのデータセットを構築。評価軸は「論点カバレッジ」と「正確さ」の2次元。以下がサンプルである：【原告の主張】被告は540万円を支払え └─【原告】保険金の支払い義務がある ├─【原告】死亡は突発的・偶発的な事故だった │ └─【原告】餅を食べて窒息死＝外因による傷害 │ └─【被告】死因は既往症の可能性が高い └─【裁判所の結論】突発的事故と認定ただし窒息死は証明不十分このような本質的に tree / DAG 構造であるタスクを従来の基準リストであったRubricで解決するのは不適である。例

Read original on dev.to