機械翻訳のポストエディティング
ポストエディティング(後編集)は、品質と生産性を向上させるために、翻訳者がコンピュータが作る訳文(suggestion)を編集する翻訳テクニックです。
ライセンスの初期費用や、翻訳システムのトレーニングに伴う費用に比べ、Translated社は翻訳料金が5-20%節約出来ることを保証します。
2002年以降、Translated社は欧州委員会、IBM、Googleなどの顧客や、その他の新進小企業のために5百万以上の単語をポストエディティングシステムで翻訳してきました。
いつ使えるのか?
1言語につき年間50万単語以上を翻訳し、既に100万単語以上を記憶した翻訳メモリをお持ちなら、1年目から投資額を回収することが可能です。翻訳量がより多ければ元手の回収は更に早まります。
実際、システムトレーニングには、翻訳するデータ量に応じて1000ユーロから5000ユーロの費用がかかり、翻訳料の割引率は、1単語につき0.01ユーロです。
当社では、高品質の翻訳を提供すると同時に、従来の翻訳方法より格段に安い値段で大まかなミスだけを訂正するGistingサービスを提案するために機械翻訳を導入しています。
利用したいと思いますが、どうすればいいですか?
ケース1:100万単語以上のメモリをお持ちの場合
- http://mymemory.translated.netに移動して下さい。
- 必要なら新規アカウントを作成し、ログインして下さい。
- 最初の無料トレーニングを行うために、あなたのメモリ(TMX形式)をアップロードして下さい。
- あなたのユーザー名を明記の上、info@translated.net宛に翻訳するテキスト(最高1000単語)を送って下さい。
- 2週間以内に以下が送られてきます:
- あなたのテキスト用にトレーニングされた統計的機械翻訳システムを使って機械翻訳された文書
- 翻訳者による修正版(ポストエディティング)。品質評価はこの最終製品で行ってください
- 他の言語のトレーニングとポストエディティングの割引プラン。
ケース2:100万単語以上のメモリをお持ちでない場合
3までの手順はケース1と同じです。4.まず、出発点として標準的なシステムを使用します。スタートアップに費用はかかりませんので、すぐにささやかな節約が可能です。
当社のポストエディティング業績
- Translated社はSystran社と協力し、人間翻訳プロセスに自動翻訳を組み込んだ新モデルをテストするという、欧州委員会のプロジェクトに取り組みました。
- Translated社はSemantixの開発に着手します。Semantixはブラウン-デラ・ピエトラ理論に基づき、集合論ベースのモデルが組み込まれた統計的翻訳エンジン搭載のNLPツールキットです。
- Translated社はAPIを使った自動翻訳サービス.SaaSの配信を開始します。会社初のGiza++/Pharaozベースの翻訳エンジンを開発します。
- Translated社はMyMemoryプロジェクトに着手し、世界中の言語情報を体系化し、翻訳メモリと機械翻訳が無料で利用出来るようにしました。
- MyMemoryは全てのメモリから検索するために内部使用されています。
- オンラインで無料利用出来るMyMemoryの単語が3億語を突破しました。
- MyMemoryが50億語を突破しました。オタワ(カナダ)の機械翻訳サミットの基調プレゼンテーションにおいて、マルコ・トロンベッティがプロジェクトを発表しました。IBM社は自社の統計技術を組み込んだ初のポストエディティングプロジェクトにTranslated社を任命しました。同様のプロジェクトで欧州委員会もTranslated社を指名しました。Google社はWebベースのCATツール、Google Translator Toolkitを開発し、最初の内部ポストエディティングプロジェクト(ツールキットを使ってツールキットをローカライズする)をTranslated社に依頼しました。
- 500億語を突破したMyMemoryは全ての主要なCATツールと翻訳マネージメントシステムに直接組み込むことが出来ます。当社のモットー:世界中の如何なる文章も2回以上翻訳されるべきではない。.