本ウェブサイトでは、スタイルシートを使用しております。このメッセージが表示される場合には、スタイルシートをoffにされている、またはブラウザが未対応の可能性があります。本来とは異なった表示になっておりますが、掲載している内容に変わりはありません。

以下のリンクより、本文へジャンプができます。

JTF翻訳セミナー(東京) JTF関西セミナー(大阪)

翻訳セミナー情報 JTF翻訳セミナー(東京) セミナー受講ご希望の皆様へ

| 活動報告一覧へ戻る |

2008年のJTF翻訳セミナー活動報告

第10回
開催日 2009年3月12日 セミナー: 14:00 〜 16:40 懇親会: 17:30 〜 19:30 [希望者のみ]
テーマ 「翻訳品質定量評価への長い道のり」
講演者 脇田 早紀子(わきた・さきこ)氏
日本アイ・ビー・エム株式会社 トランスレーション・サービス・センター(TSC) 品質コーディネーター
概要 翻訳品質を数値で表したいという願いは、品質を管理し、向上させていきたいと思う人に共通のものである。しかし、立場も違う数多くの人が納得する指標を示すことにも、それを実際に測定することにも、困難な課題がいくつも含まれている。
本講演では、現実的な手間で実用的な評価をするために克服しなければいけない課題について述べ、日本IBMでは現在までにそれらとどのように折り合ってきたのかを報告する。また、そのように得られた評価の活用方法についても提案する。

【対象】
○翻訳会社の経営幹部・営業・コーディネーター・QAの方
○一般企業の翻訳発注担当者の方
○品質管理に興味のある個人翻訳者の方

⇒本研究会の講義内容をDVDで受講できます

【講師略歴】
1991年にIBM 東京基礎研究所の研究員として入社し、新聞社を主なお客様とする日本語校正支援システムの研究開発に従事。
1998年、TSC に移り翻訳プロジェクトを担当。
2002年から品質専任となり、誤訳チェッカー開発、品質管理プロセス構築などを行っている。
品質の定量評価は2002年より実施。
現在は、翻訳品質の測定とフィードバック、翻訳ガイド発行などを主に担当。

2008年度 第10回JTF翻訳セミナー報告

 翻訳の品質管理は最も重要な項目の一つであるが、翻訳発注元である日本IBM では翻訳会社から納品された翻訳物を数値化できる基準で品質評価し、品質の管理を行っている。第10回研究会は、日本IBM での翻訳品質評価方法について脇田氏が詳細に語った。

初期の品質管理
 品質管理係の創設は2000年末だった。それ以前は、IBM 社内の翻訳発注者であるプロジェクトマネージャ(PM) が個別の方法で品質管理を行っていた(あるいは、あまり行っていなかった)。品質の定量評価の要請は当初からあったので、当時行われていた「レビュー」のプロセスで生じる赤字原稿をチェックして修正個所を数える方法を検討したが、これは評価のベースには到底なりえないことがわかった。レビュアーによって赤字を入れる個所の傾向がまったく異なったり、同じレビュアーでも、かけられる時間やレビュー対象の分量によって修正の密度が著しく異なったりしていることが明らかになったからである。

品質の数値化
 2002年に、これらのばらつきを抑えた上で定量的に評価する手法を検討し始めた。レビュアーを1人に固定し、レビューの分量と時間も固定(100ページ/8h)したうえで、修正個所を重要度に基づいて分類し、重み付け合計により評価値を算定した。この方法で翻訳物の品質が数値で表せるようになり、相対的に品質が低い資料を指摘することなどができるようになった。しかし、品質基準の妥当性やレビュアーの力量、レビューの分量と時間の最適化などに課題があり、評価の精度には疑問が残った。これらを踏まえて、人や日によってブレない評価、感覚に合う評価を算出できる分類やカウント方法などについて、実験を繰り返しながら検討を続けた。
 具体的には、同一資料を二人のレビュアーで評価する「ペア評価」を導入したり、レビュアーのスキルにより補正値を導入したり、レビューの分量や時間を最適化したりしている。「ペア評価」は、レビュアーの実力を把握しやすいこと、他レビュアーと比較されるという緊張感で評価精度が向上すること、パートナーの結果を参考にしてスキル向上が見込めることから、この手法はかなり有効である。また、初期に定めていた100ページ/8h ではかなりレビューが荒くなることがわかったため、現在は25ページ/5h と設定している。

納品物検査
 また、評価の活動の中で、いわゆる「誤訳」にはかなり単純な取り違いなどが多く含まれており、これが品質を下げている大きな要因であることがわかった。そこで、2003年に、対訳用語集を利用した誤訳チェッカーを開発し、それらをツールで検出できるようにした。
 さらに、ツール検出による評価と、人による評価には高い相関があることがわかり、誤訳チェッカーによる効率的な納品物検査を実施できるようになった。これにより、品質の推移や、翻訳会社ごとの比較などができるようになったことは画期的なことだったが、ツールが検出できる誤りは幅が狭いため、この部分に特化した「対策」が進んでしまい、本来あるべき品質をゆがめる場面も出てきた。
 そこで、2007年には、納品物検査は継続しつつ、ツールではなく人による検査を行うことで幅広く品質を把握できるよう改善した。その代わり、検査できる分量に限りがあるので、現在では月100件程度の資料につき、新規翻訳個所から約2000ワードを抜き取り検査することで対応している。
 検査結果はすべて判定を付けて翻訳会社にフィードバックし、数値化して記録している。判定が悪い場合は、その原因となった態勢やプロセスの振り返りを行い、報告してもらうようにしている。振り返りによる具体的な改善の積み重ねが、明日の確実な品質改善の手がかりになると考えている。

まとめ
 どんなに工夫をしても、評価に誤差はつきものであるが、数多く積み重ねることで現実的に信頼に足る品質データを得ることができる。過信せず侮らず、評価を有効活用していきたい。

報告者:早舩 由紀見(個人翻訳者)


活動報告一覧へ戻る

ページトップへ