court tech:最高裁流音声認識システム開発
毎日jp:裁判員制度:証言瞬時に文字化…最高裁が音声認識システム
昨年春にcourt_techno:音声認識なるか?として紹介したニュースの続報であろう。
開発元はNECだそうなのだが、ちょっと信じにくい記述が。
「公開されたシステムは、マイクで拾った音声を前後の文脈から判断して文字化し、証言席を撮影した映像や音声と結びつけて記録する。検索画面にキーワードや発言者を入力して確認したい場面を絞り込んでいき、録画されたやりとりをパソコンで再生する仕組みだ。
最高裁はNECに委託し、05年から約4億円をかけて開発した。実用段階では8割の認識率を目指すが、そのレベルに近づきつつあるという。」
菅原郁夫教授や笠原毅彦教授のハイテクコートのシステムが下敷きになっているようで、それ自体は極めて望ましい方向であろうと思う。
しかし、文字の認識率8割ということは、実用段階といえるのか?
文字情報は単に検索のために用いるのであって、それ自体は逐語的証言調書を目指さないということであろうか?
そうだとすると、即時にスクリプティングが可能な速記官による電子速記(はやとくん)や、富士通&B.U.Gの再発話を介した音声認識システムの必要性は揺るがない。
これらについては、このブログでも既に取り上げている。
justice:電子速記「はやとくん」
裁判員裁判のeサポート
| 固定リンク
「法律・裁判」カテゴリの記事
- Arret:欧州人権裁判所がフランスに対し、破毀院判事3名の利益相反で公正な裁判を受ける権利を侵害したと有責判決(2024.01.17)
- 民事裁判IT化:“ウェブ上でやり取り” 民事裁判デジタル化への取り組み公開(2023.11.09)
- BOOK:弁論の世紀〜古代ギリシアのもう一つの戦場(2023.02.11)
- court:裁判官弾劾裁判の傍聴(2023.02.10)
- Book:平成司法制度改革の研究:理論なき改革はいかに挫折したのか(2023.02.02)
コメント
>文字の認識率8割ということは、実用段階といえるのか?
約10年前の音声文字認識率は、82.3%でした。発話者の音声フォルマント登録をしても90%を切る状態でした。σ(^_^)は某所のテスターだったから統計処理してます。音声フォルマントは個体差が激しくて、ドッグイヤーと無関係な部門です。
特に方言が入ると(典型的な関西弁でも)メタメタでした。もちろん、若者スラングや業界ジャーゴン入ると、関東弁(標準語?)でも誤認識が続きました。特に主語を省略した流行略語(援交、スタバ、マクド…)は、円光、廃場、真九度…とイミフでした。_| ̄|○
これらの誤認識学習機能がオンであることを祈ります。
投稿: ハスカップ | 2008/05/30 00:23
OCRソフトでも、例えば99%の認識率を誇るといっても、100字に一つ間違いがあるというわけだから、ハスカップさんのコメント程度の長さでも2つか3つ間違うというレベルですね。
これが8割となれば、ほとんど間違いだらけと言っても過言でないレベルでしょう。
全体の20%も誤認識で間違えがある文章を、果たして人は読めるのか?
投稿: 町村 | 2008/05/30 00:29
今のシステムはもう音声フォルマントは使わないんじゃないかな。
それはおそらく何世代か前の音声認識システムの話しだと思う。
投稿: s | 2008/05/30 00:31
>sさん
そうですか。時代は進化したんですね。情報提供ありがとうございました。システム変更向上で、音声認識率も向上して欲しいですが、広義の生体認証だから認識率の向上は難しいのかな?と思います。
ヨストの法則でもパレイトの法則でも、80%を超えたあたりから100%近くになるまでは、死のロードが待っているわけですから無理は言えません。
投稿: ハスカップ | 2008/05/30 00:51
>町村先生
>ハスカップさんのコメント程度の長さでも2つか3つ間違うというレベルですね。
IME誤変換も(^^ゞポリポリ
>全体の20%も誤認識で間違えがある文章を、果たして人は読めるのか?
口語表現の助詞助動詞が加わるともっと苦手みたいです。
●行動確認で>>公道確認でor坑道確認で
●死体遺棄し>>肢体息死
●現逮する>>減退するor原隊する
●ぶっ殺すか>>物故ロスか
投稿: ハスカップ | 2008/05/30 01:17
現段階での音声認識レベルでは調書は無理、でもインデックスになれば・・・
と最高裁が方針転換しましたね。
「はやとくん」や再発話を介した音声認識システム、必要性は高いのでしょうが、費用対効果の観点からはどうでしょうか? 調書(紙面)なみに簡単に証言の録画を検索・確認できるなら、その方が有益とも思えますが。
投稿: 通りすがり | 2008/05/31 09:15
DVDの音声サブトラックに速記官の速記コード(FDに入れて速記官が持ち帰るもの)を入れた方が早くローコストでできるでしょう。
もっとも最高裁は速記官全廃を前提のシステムですが(裁判所用速記マシンが製造中止になったから)。
投稿: ハスカップ | 2008/05/31 09:51
通りすがりさん、
コストはたぶん音声認識+ビデオ録画でしょうが、紙の調書のような使い方を実現しようと思えば、高いものにつくのではないでしょうか?
なにしろ紙媒体は、一覧性に優れているだけでなく、一人一つを、自分の必要な箇所をその場で閲覧でき、携帯性もあり、データも壊れにくいです。メモも書けるし付箋も貼れます。
パソコン上でも実現可能ですが、裁判員一人一人に必要に応じた参照を可能にしようと思えば、法廷と評議室をパソコン教室のようにしてオンデマンド配信を可能にしないとなりません。
もう一つ、聴覚障害者の裁判員には同時スクリプトが不可欠です。
投稿: 町村 | 2008/05/31 10:20