検索

小技の森

No one learns as much about a subject as one who is forced to teach it.

カテゴリー

Trados

正規表現の第一歩:縦棒区切りで複数語句を一括検索

テキストエディタや翻訳支援ソフトなど、テキストを扱うソフトでは、文書内を検索するときのダイアログボックスで「正規表現」という検索オプションを選べるものが数多くあります。この正規表現というオプションは一体何だろう、と思ったことはありませんか。

170114_regex_dialog

正規表現というのは、検索語句を指定する特別な記述方法のことです。特有の意味を持つ記号を使って、単純な語句検索よりも手の込んだ条件を指定することができます。いったん身に付けてしまえば、とても便利で強力な機能です。

しかし、まったく初めての段階では、かなりハードルが高くて取っつきにくい機能でもあります。しかも、その段階でヘルプ等を読んでも、使い方がよくわかりません。たとえば、テキストエディタ「EmEditor」のヘルプで、「正規表現を使用するには」という項目を見ると、次のように書いてあります。

「正規表現は、開いている文書または複数のファイルからテキスト パターンを見つけるのに使用できます。正規表現は、通常の文字、つまりリテラル (たとえば、a から z までの文字)、メタ文字と呼ばれる特殊文字から成り立つテキスト パターンです。このパターンはテキスト検索時、1 つまたはそれ以上の文字列と一致します。」

いきなりこんな説明をされても、何が何だかサッパリわからん、という感じです。最初の段階では、こういう小難しい話は抜きにして、知識ゼロでも試せる簡単なところから少しずつ慣れていくのがよいのではないでしょうか。

というわけで、正規表現について何も知らないけれど検索で使ってみたい、という方は、取りあえず次の1つだけ覚えて試してみてください。それは、「テキスト内を検索するときに、正規表現モードをオンにして、複数の語句を | (半角の縦棒)で区切って指定すると、そのすべてを1回でまとめて検索できる」という機能です。

たとえば、英文のテキストの中で、“happy” “happily” “happiness” が出てくる箇所を見ていきたいと思ったときには、3つを別々に検索しなくても、正規表現をオンにして、検索文字列に「happy|happily|happiness」と指定すれば、1回でまとめて検索できます。

170114_emeditor_regex_happy

あるいは、日本語のテキストの中で “笑う” という単語が出てくる箇所を、活用形も含めて検索したいと思ったときには、正規表現をオンにして、検索文字列に「笑わ|笑い|笑う|笑え|笑お|笑っ」と指定すれば、“笑う” の五段活用すべてを1回で検索できます。

縦棒で組み合わせる語句は、必ずしも派生語や活用形どうしでなくても、何でもかまいません。たとえば、英文の中で “network” “platform” “communication” に注目したいと思ったら、「network|platform|communication」と指定すればよいわけです。

つまり、正規表現を使って検索語句を指定する際には、半角縦棒は「または」の意味を表す、ということになります。正規表現が持つ膨大な機能の中で ほんのさわりに過ぎませんが、これを知っているだけでも、便利な場面はあると思いますので、よろしければお試しください。

このように、特有の意味を持つ記号を使って、単純な語句検索よりも手の込んだ条件を指定できるのが、正規表現の特長です。工夫次第で、さまざまな形で活用できます。

※本当は、1つ目の例は「happ(y|ily|iness)」、2つ目の例は「笑[わい-おっ]」と指定するほうが、オーソドックスな正規表現になります。縦棒と同じように、( ) や [ – ] も、正規表現で特有の意味を持つ記号です。でも、そのあたりを深追いしていくと、すぐに小難しい話になってしまいますので、ひとまずは縦棒のみを使った検索を試してから、細かいことは おいおい身に付けていけばよいかと思います。

広告

訳文を元の文書形式で確認する

Trados Studioで翻訳作業をしていると、原文と訳文を対比する画面構成になっているため、翻訳している文章の文脈がとりづらいときがあります。そのために用意されているTrados Studioの「プレビュー」機能。

この機能では、[表示] ペインの [情報] リボンにある [preview-iconプレビュー] をクリックすると、下の画像のようにTrados Studioのユーザーインターフェース内に元の文書形式で訳文を表示することができます。

%e3%83%97%e3%83%ac%e3%83%93%e3%83%a5%e3%83%bc%e6%a9%9f%e8%83%bd

今日の小技は、上記のように訳文をTrados Studioの画面内で確認するのではなく、実際の元の文書形式そのもので表示する方法です。それには、「別名(訳文のみ)で保存」機能を使用します(※)。
※本来は、翻訳が完了したあとで訳文を含む文書を生成するための機能だと思うのですが、わたしは翻訳途中で訳文を確認するときにも、比較的頻繁にこの機能を使って訳文の最終形態を確認しています。

手順は、次のようになります。

  1. 作業内容を [エディタ] 画面で保存します。
  2. [エディタ] で翻訳対象ファイルを開いた状態で、[ファイル] > [別名(訳文のみ)で保存] をクリックします。
  3. プロジェクトファイルがあるフォルダの訳文フォルダ(訳文が日本語の場合は「ja-JP」フォルダ)に保存された訳文ファイルを開きます。
  4. 原文と同じ文書の表示形式で訳文を確認します。

例えば、こんなパワーポイント資料があったとします。

%e3%82%b5%e3%83%9e%e3%83%aa%e3%83%bc
このファイルをTrados Studioで読み込み、翻訳したあとで、「別名(訳文のみ)で保存」すると、次のように実際にパワーポイントとして訳文を開くことができます。
%e8%a8%b3%e6%96%87ppt
若干、訳文がパワーポイント内に収まっていないところがありますが、きちんとパワーポイントとして表示できています。

この方法のよいところは、訳文を実際の文書を直接作成するのと同じ操作で確認できるところです。大きい画面で確認できますし、ページ数が多いときなどは、Trados Studioの画面内ではなく、実際の最終文書を確認したほうが、ページのスクロールや拡大/縮小なども簡単にできます。

ちなみに、この機能は、翻訳対象のファイル形式がTrados Studioで対応しているファイルであれば使用できます。Trados Studioで対応しているファイルの種類は、[ホーム] > [プロジェクトの設定] > [ファイルの種類] で確認できます。
%e3%83%97%e3%83%ad%e3%82%b8%e3%82%a7%e3%82%af%e3%83%88%e3%81%ae%e8%a8%ad%e5%ae%9a-%e3%83%95%e3%82%a1%e3%82%a4%e3%83%ab%e3%81%ae%e7%a8%ae%e9%a1%9e
Trados Studio 2015では、Word、Excel、HTMLファイルでもこの機能が使えることがわかります。また、上記の一覧にあっても、Trados StudioのSDL XLIFF形式のみで提供されているような場合(原文がバイリンガルファイルのみ提供されている場合)などは、この「別名(訳文のみ)で保存」機能は使用できません。

そのときは、仕方ないので、想像力を駆使してTrados Studioのユーザーインターフェース内で最終的な文書形式を想定して文脈を読むことになります。Trados Studioのユーザーインターフェースでは、画像や段落、改行などの情報を除いた原文と訳文の対比画面のみになるため、文脈を読むことが難しくなり、Trados Studioでの翻訳に限界がある要因のひとつになると考えられます。

そういう意味で、訳文でも元の文書の表示形式で確認できるような形態で翻訳対象ファイルが提供されることは、翻訳の質を高めることにつながるような気がします。

追記1: この記事を書くのに、今回プレビュー機能を久しぶりに確認したのですが、その表示がきれいなことに驚きました。昔はもう少し表示が簡素だったような気がしたのですが。。(そのときはHTMLファイルだったので、スタイルシートが読み込めずに表示が簡素だったのかも?)PPTの場合は、プレビュー機能で十分な気もしました(ここまで書いておいて…)。

追記2: この記事を書いた後で、プレビュー機能ってこんなに綺麗に表示されたっけ…と思い、プレビュー機能について検索していたら、他の翻訳者さんのこちらのブログ記事でTrados Studio内に直接、訳文のパワーポイントを開く機能が用意されていることを知りました。。今回の例では、[エディタ] でファイルを開いた状態で、[ファイル] > [印刷 & 表示] > [表示] > [訳文のMicrosoft PowerPoint] から パワーポイントを開くことができました。。これからはこの機能を使用しようと思います。。ツールって奥深いですね(汗)%e5%8d%b0%e5%88%b7%ef%bc%86%e8%a1%a8%e7%a4%ba

知らないということは恐ろしいこと

とりあえず、何を書きましょう。まず1つ、ほとんど誰でも知っているだろうけど、つい最近まで(教えてもらうまで)自分が知らなかったことについて。なので、とても恥ずかしいことではあるけれど、まだ知らない人も何人かはいるのではないかと思ってご紹介します。

普通、Excelで用語集をもらった場合、みなさんはどうしていますか?私の場合、大きな用語集なら迷わずTradosのMultitermに取り込んで使います。そうすると、その用語が当たるとTrados上(「用語ベースの検索」や「用語認識」のウィンドウ)に自動的に出てくるので、これが一番便利。なので、Excelのままで検索するなど、これまで考えたことはあまりなく、検索の使い勝手も悪すぎて「使えない」と思い込んでいたのでした。

小技キャプチャ1

ところが、先日もらった用語集は、ご丁寧にもアルファベット順にシートが独立していて、そのままではMultitermに取り込めないのです。つまり、1つのシートにまとめないとうまくいきません。そこで、コーディネータさんに聞いてみました。全体が1つのシートにまとまったのはないのですか、と。

そのときの回答、「ご存じとは思いますが・・・」という前置きで、以下、勝手に引用:

申し訳ないのですが、1シートにまとまった状態のものはございません。
お役に立つかはわかりませんが、検索オプションで検索場所を「ブック」に
していただくと、多少使いやすくなるかもしれません。

あ、そうなんだ!ブック全体で検索できるんだ! ということに、やっと気がついたのでした。これまで、シート単位でしか検索できないと思い込んでいたのでした。私は一体何をやっていたのでしょう。知らないということは恐ろしいこと。顔から火が出ます。

そのJOBの用語集はMultitermに取り込まず、そのままブック単位で検索しました。

こわざキャプチャ

今回の教訓: すぐに「使えない」と思い込まず、何かオプションがあるはずだ、と探してみること。

 

TradosのコメントをExcelにエクスポートする

訳文に対するコメントをExcelのスプレッドシートにまとめて、成果物とともに納品するように依頼されることがよくあります。その場合、せっかくTradosに専用のコメント機能があるのに、Tradosに訳文を入力してから、Excelに移動して、作業対象ファイル名やセグメント番号を記入し、Tradosから原文と訳文をコピペして、Excelでコメントを書くという冗長な作業をしなければなりません。場合によっては、前の方のセグメントに戻って、追加でコメントを記入したり、一度コメントを付けたセグメントの訳文を直したりと、何度もTradosとExcelの間を往復する必要も出てきます。

そんな時には、Comment View Pluginを使って、Tradosに入力したコメントを納品直前に一括してExcelに出力すると便利です。

【手順】
1. 上のリンクから使用しているTradosのバージョンにあったComment View Pluginをダウンロードして、インストールします。

2. Tradosを起動し、コメントの入力されているファイルを開きます。エディタビューにファイルが表示されます。
EditorView.jpg

3. ファイルビューに移動し、上部ペインでファイルを、下部ペインで[Comment View Plugin]タブを選択します。上で選択したファイルに入っているコメントが下のペインに一覧表示されます。
FileView

4. 下のペインにある[Export Comments]ボタンをクリックし、エクスポートする項目を選択して、[Export]します。
ExportDlg

指定した項目がワークシートに書き出されます。このシートをExcelで開くとこんな感じ。
ExportFile
Target列には訳文が表示されますが、コメントをつけた部分が青の太字で表示されます。以前は対象箇所を選択してフォント色やらスタイルやらを変えていたことを考えると涙ものです(T-T) 。

※セル内の[文字の配置]の[縦位置]が[下詰め]になっています。必要に応じて、修正してください。

5. このExcelシートを煮るなり、焼くなり、好きなように加工して、成果物とともに納品します。

ぜひ、お試しください♪

Trados Studioでロックされていないセグメントだけを表示する

Trados Studioを使用する翻訳案件で、ロックされている文節が含まれている場合があります。ロックされている文節は前後関係を把握するには、確認する必要がありますが、最終的に機械的なチェックをするときには表示させたくない場合があります。

そのような場合、Trados Studioの「フィルタ」という機能を使用すると、ロックされていない文節のみを表示することができます。

例えば、次のような色々なステータスのセグメントがあるとします。image01

1番目のセグメントのみがロックされており、ほかのセグメントは「翻訳承認済み」「翻訳却下」「翻訳中」「翻訳済み」のステータスです。

上のリボン「レビュー」から、「フィルタの表示」、「すべての分節」(デフォルトは「すべての分節」になっているはずです)とクリックして、「ロック解除」(下図では赤線で囲んであるメニュー)をクリックします。image02
「ロック解除」をクリックしたら、すでにロックされている箇所がロック解除されてしまわないだろうか…と思われるかもしれませんが、大丈夫です。こちらの環境で、上記の手順で「ロック解除」をクリックすると、以下のようにロックされた1番目の分節のみが非表示になりました。image03
わたしの場合は、ロックされた分節を含む翻訳の場合は、特に最後のチェックをするときにこの方法でロックされていない分節を表示して確認しています(翻訳の分量が多いときは、翻訳作業をするときにも利用します。ただ、文脈が見えないときがあるので、そのときはフィルタを解除しています)。

「ロック解除」のフィルタを適用した状態で訳文側をコピーすると、ロックされた分節はコピーされないので、そのままテキストエディタやWordファイルにロックされていない箇所だけをコピーすることもできます。

ちなみに、この「ロック解除」は、英語のオンラインヘルプを確認すると、英語版は「Unlocked」でした。image3

「Unlocked」と過去形(もしくは完了形)になっているのだから、せめて「ロック解除済み」にしたら少しは意味が伝わるかもしれないとも思いますが、実際には、ロックはまだしておらず解除もしていないわけなので、「未ロック」あたりが適訳なのではないか、などと考えたりもしています。

UI翻訳をしているときには、こういう画面での文脈をとらえた訳ができないのが難しいところなので、なんとも言えないのですが。

補足:上記の画面はTrados Studio 2015の画面です。

WordPress.com Blog.

稼働中 ↑