選定理由 Paper: https://arxiv.org/abs/2512.01020 Code: N/A 概要(データセット論文) 【社会課題】 法的推論タスクにおける信頼性評価において、最終的な判決の正誤だけを見ていては不十分。途中の推論プロセスの妥当性を測る手段が必要。 【データの設計と従来技術の限界】 裁判所判決文を Issue Tree(法的論点ツリー) に変換し、葉ノードに対しルーブリック基準を適用可能にした。原告・被告・裁判所の主張をツリー構造で整理した約24,000インスタンスのデータセットを構築。評価軸は「論点カバレッジ」と「正確さ」の2次元。以下がサンプルである: 【原告の主張】被告は540万円を支払え └─【原告】保険金の支払い義務がある ├─【原告】死亡は突発的・偶発的な事故だった │ └─【原告】餅を食べて窒息死=外因による傷害 │ └─【被告】死因は既往症の可能性が高い └─【裁判所の結論】突発的事故と認定 ただし窒息死は証明不十分 このような本質的に tree / DAG 構造であるタスクを従来の基準リストであったRubricで解決するのは不適である。例
Liked this? Start your own feed.
Comment
Sign in to join the discussion.
Loading comments…