2012年06月22日

中学・高校英語の文を高品質に翻訳できる画期的な日英翻訳エンジンを組み込んだ英作文学習支援ツールのインターネットサービスを開始

株式会社ラングテック   http://www.languetech.co.jp/

株式会社ラングテック(本社:東京都世田谷区、代表取締役社長:宮崎正弘)は、中学・高校英語の文を高品質に翻訳できる画期的な日英翻訳エンジンLaurelを研究開発、これに翻訳過程を可視化する機能などを組み込み、日英翻訳エンジンを積極的に利用した、インターネット上で英語学習者が英作文を学習するのを支援する英作文学習支援ツールを開発した。インターネット上で6月20日より無料の試行サービス、8月下旬より有料の本サービスを開始する。

ラングテックはもともと、現在、新潟大学名誉教授でもある宮崎社長が新潟大学・教授在職中の2006年に創業した新潟大学発ベンチャーで、宮崎研究室で長年、取り組んできた日本語処理などの基礎研究の成果を製品化するために設立された。意味の扱いに定評のある、時枝・三浦の言語モデルをベースに意味と親和性のある文構造を出力する高度な日本語解析ソフトを研究開発してきた。また、これを日英間の発想の差を吸収する日本語書き換え技術と統合し、英作文や英会話の基礎となる中学・高校英語の文がその典型である一般的分野の日本語文を対象にし、意味・ニュアンスの差を可能な限り正しく表現した自然な英語文に翻訳する、規則・用例融合型の日英翻訳エンジンLaurelを研究開発した。

中学・高校英語の文は、構造が単純な短い文が多いにも関わらず、既存の翻訳ソフトでは案外うまく翻訳できなかった。これは、機械翻訳の対象とすることが多い技術文などに比べて、中学・高校英語の文は英語に翻訳しにくい表現が多様で微妙なニュアンスをもつ文や日本語的発想で書かれ日英間で文構成要素間の対応がとれないこなれた日本語文が多いことによると考えられる。Laurelでは、意味と親和性のある文構造を出力し、原文の意味・ニュアンスをも可能な限り抽出する高度な日本語解析や日英間で発想の差を吸収する日本語書き換え技術や用例翻訳などを導入すると共に、態(他の人に何かをさせる使役、他から動作・作用などを受ける受身など)、時制、相(事象の開始・持続・完了・状態性など)、様相(推量・義務・要求・意志などの事象・状態に対する話者・書き手の心的態度)、比較、否定、仮定法、同形語・多義語、前置詞、冠詞・所有形容詞(所有格)、数、省略要素の補完など文法的・意味的に細かな点にも気を配って翻訳することによって、高品質な翻訳を可能としている。

日英翻訳エンジンを英作文学習支援ツールに組み込んで利用するため、翻訳過程の可視化や訳文生成過程における構文選択など、従来の翻訳エンジンにない機構も組み込んだ。既存の翻訳ソフトでは、入力である原文と出力である訳文だけしか外部から見えないブラックボックスと化しているため、なぜそのような訳文が出力されたのかわからない。そこで、Laurelの翻訳過程を可視化し、なぜそのような訳文が出力されたのか、日本語的発想の日本語文をどのように英語に翻訳しやすい日本語文に書き換えたり、日本語文に多い省略要素をどのように補完したりして翻訳したかなどをユーザに提示するようにしている。また、複数通りの訳出が可能である場合、学習内容の単位である単元に合致した構文を使った訳文を選択的に生成する機構を組み込んだ。これによって、連体節を含む文を、関係代名詞の単元では関係代名詞節で訳出したり、分詞句の単元では分詞句(現在分詞、過去分詞)で訳出したりすることを可能とした。

入力文である日本語文の表現を、日英翻訳の観点から大分類・中分類・小分類・細分類の最大4階層に分類・体系化し、末端の分類項目に関連するいくつかの対訳例文対を配置した独自の日本語表現分類体系を構築・利用することによって、各分類項目を単元として学習を進めていけるようになっている。対訳例文対の日本語文をそのまま翻訳(翻訳過程をみるため)したり、一部語句を追加・修正のうえ翻訳したり、翻訳したい文(48文字以内)を自由入力したりすることができる。

本ツールは、個人向け、教育機関向け、企業・団体向けの3つのインターネットサービスが用意されている。小学校、中学校、高校、高専、短大、大学、塾・予備校などの教育機関の先生が英語の授業に利用するだけでなく、学校や塾で英語を学んでいる生徒・学生、英語で情報発信するため英語を基礎から学び直したり、英語力をスキルアップしようとしたりする一般社会人にもインターネットを利用した手軽で有効な英作文学習支援ツールとして幅広く利用してもらうため、特に、個人向け、教育機関向けには、手頃な価格で提供される。個人向けには年額18,000円(月額1,500円相当)、教育機関向けにはID数が1、または2の場合、1ID当たりの価格は個人向けと同じであるが、ID数が3以上の場合、1ID当たりの価格は個人向けより割安(1420~500円)となり、ID数50の場合1ID当たり840円となるなど契約ID数が多いほど割安となる。

6月20日から開始する試行サービスでは、単文(主部と述部の関係が1つだけある文)、連体節を1つ含む文、主節と1つの従属節で構成された文、2つの並列節で構成された文が翻訳対象となる。試行サービスは無料であるが、試用に当たってはUIDとパスワードが必要。現在、試行サービスの申し込みを受け付け中(詳細はラングテックの公開WEBを参照されたい)。なお、試行サービスは原則としてユーザ当たり1回に限定されており、有効期間は1か月である(有効期間1か月過ぎても有料サービスが開始されていない場合、有料サービス開始時まで有効)。8月下旬から開始する有料サービスでは、基本名詞句・基本複合名詞が新たに翻訳対象となる。その後、複合固有名詞、複雑な名詞句、複雑な複合名詞・複合用言などを順次、翻訳対象としていく予定。Eメールやツイッターなど文字で表現される文では話し言葉風の表現が多いことを考慮して、書き言葉だけでなく話し言葉にも対応するため、ことわざだけでなく会話文などの定型表現も順次、翻訳対象とする予定。

一般に翻訳では複数通りの訳出が可能であり、このような変換・生成過程で生じる構文・訳語の曖昧性などを保持し、必要に応じてその選択肢と選択基準を提示し、ユーザの選択により別な訳文を出力する機能も英語学習者にとって有益である。英語文音声出力機能により翻訳文を読み上げる機能、英語学習者が犯しやすい翻訳誤り例を収集・データベース化して利用すること、英日翻訳エンジンの利用なども考えられる。並列した連体節を含む文、2つ以上の従属節/並列節を含む文、主節や従属節に連体節を含む文など構造が複雑な長文に関しては、当面、翻訳対象外としているが、長文を構造の単純な短い文に自動分割して翻訳することを考えている。文脈や高度な意味処理に必要な知識を効率的かつ的確に検索できる連想機能と多くの分類観点をもった多次元シソーラスを融合した連想型多次元シソーラスを利用した高度な解析や構文・訳語の選択も中長期的な取り組みが必要である。

このように、本ツールは発展途上のものであり、今後、多くのユーザに実際に本ツールを使ってもらい、ユーザの意見を集約して、ユーザインタフェースの改良、より使いやすい機能の導入などを進め、より良いツールとしていく予定である。

株式会社ラングテック
代表取締役社長 宮崎正弘
東京都世田谷区砧3-19-5
http://www.languetech.co.jp/
info@languetech.co.jp
〒157-0073 東京都世田谷区砧3-19-5
tel:03-6807-8761
fax:03-6807-8761