2022年12月20日火曜日

フォーラム投稿のための日英翻訳のお話(´・ω・`)

パッチ投稿もバグ報告も直接simutrans forumにしてもらうのが、もっとも貢献度が高く効率もいいので
そういう貢献者が増えて欲しいので日本語の英訳について話すね。


この定食の主要成分

  • 日本語を機械翻訳させるコツ
  • 欠けてる単語を補え
  • 外国人風日本語を翻訳させる
  • 長文にしないで細かく分ける
  • DeepLとGoogle翻訳どっちがいい?
  • あなたは何語を喋りますか?になんて答える?



(´・ω・`)次の2つの日本語どっちが自然だと思う?

  1. 今日映画行かない?
  2. 今日私と一緒に映画を見に行きませんか?
外国人が喋る日本語ってだいたい2番になると思うの。
でも文法的に全然間違ってないわけじゃない。
これくらいネイティブとネイティブじゃない人って差があると思うの、英語側でも。
ネイティブレベルの英語なんて求めてないのだけど、上の例文で言いたいのは、
日本語と英語は違い過ぎで、日本語って色々省かれ過ぎてるってことね。
それでも通じる高度な意思疎通技使ってる変態語と変態謎生物が日本語と日本人だと思います(´・ω・`)

つまり、そのままの日本語を翻訳にかけると、色々情報足りなすぎて酷い英訳になるのよ。
「誰」と「誰が」、「何をしに」とか情報欠けちゃってるのよ。
よく言われるの主語が無いってやつね。主語ないと勝手に私達とかって勝手に訳して主語大きくしてくれたり
でもそれ以外にも一杯欠けてること多いよ。察してってやつね。
だから外国人が喋る日本語みたいなの作って翻訳機にかけるとそれっぽい英語になると思います。
外国人が喋る日本語ってのは、英語の教科書の文章を単語1個1個直訳してパズルみたいに組み替えた文章、みんな作らなかった?そういうのね。

らんらんが言いたいのは、その前に外国人みたいな日本語文章作って翻訳機かけた方がいいよってこと。
主語を必ず入れるとか、一回出た単語は「それ」とか「あれ」にして翻訳機かけるとか。複数形意識して複数らな「それら」とか「あれら」にするとか。
翻訳した英文を再度翻訳しろってアドバイスする人は多いと思うけど、もちろんそれもやってね。
ただしこの確認方法は単語の間違いに弱いよ。でもジャングリッシュ使いほとんど同じ間違いするので察してくれると思う。

日本語完璧やん?ってレベルの某マルチリンガルyoutuberが日英機械翻訳の信頼度30%くらいって言ってたんだよね。独⇔英なら95%くらいとも。そりゃ同じ言語系だからね。数年前の話だけど。
日常会話ならかなり使えるレベルになってきているんだろうけど、
フォーラムのやり取りって専門用語も多くて、割とフォーマルで全然日常会話じゃないんだよね。だから訳す前の日本語が長文になりがち。
長い文章にしないで細かく文区切ったほうがいいよ。
逆翻訳してたら分かるんだけど長文訳させると、関係性みたいなのが崩壊してること多くて、翻訳機に依存してるような平均的ジャングリッシュ力だと、日英翻訳はうまくいったけど英日翻訳が悪いってパターンなのかどうかもよく分からないと思う(´・ω・`)
だから細かく短い文章が全部正しいってのを目指した方がいいと思います。


DeepL vs Google translate

無料の自動翻訳でだいたいこの2つの候補が挙がってくるよね。
あくまでフォーラムに書く目的で使用した場合の、らんらんの感想書いておきます。

ずっと使ってて時々バージョンアップされたりでその都度使用感変わってきてたりするので、今はこうだけどって感じね。
基本的にはどっちも大差ないと思うのだけど、
DeepLのほうがいい感じの文章作ることもあれば、
Google translateのほうがいい文章作ることもあると感じてる。
らんらんも義務教育レベルのジャングリッシュ力しか無いので注意してね。

DeepLは複数の翻訳候補を提示してくれるけど、
義務教育レベルのジャングリッシュ力だと、はっきし言ってどの選択肢がベストかなんて分からないよね(´・ω・`)

それとDeepLはものすごい口語っぽい訳をちょくちょく返してくる気がする(´・ω・`)
訳させてる文章の問題もあるのかもしれないけれどね。
フォーラムは一応フォーマルな場所なんで、だかららんらんはGoogle translate派です。
ちょっと上手い翻訳にならないなぁって時にDeepLも使ってる。

ちなみに上に出した例文の1.を翻訳にかけてみて?
らんらん的にはどっちの翻訳も意味変わってるからハズレだなって(´・ω・`)
だから上で言ったように外国人風日本語を投げたほうが上手くいくこと多いと思うよ。

あとらんらんは翻訳機に七色変化球しか投げないので、普通にやってああなってるって思わないでね(´・ω・`)


使用言語表記について

フォーラムに登録する時に自分が喋れる言語を書く欄があるのだけど、
ニッポンジンもどきみたいなニンゲンが一杯居るんだよね(´・ω・`)

あなた何語喋れる?
What language do you speak?

に対する答えは
  1. Japan
  2. Japanese
どちらが正解?
1.の私は日本国喋りますなら、Japanの略の2文字国コードは JP で、
2.の私は日本語喋りますなら、Japaneseの略の言語コードは ja なのよ。

en-USとかja-JPみたいな表記みたことない?これ言語-国の組み合わせなのよね。
フォーラムの下の方にある日本語掲示板へのリンクも"JA"になってるでしょ。
Simutransの日本語翻訳ファイルって ja.tab でしょ。jp.tabじゃなくて。
(大文字小文字の違いはどうでもいいと思う)

尊師やフォーラムにも割と居るotakuとかの日本文化大好きでちょっと日本語齧りましたみたいな外国人が間違えるのはいいのよ。
フォーラム見ててもね、やっぱちゃんとしたニッポンジンはみんな間違ってないのよ。特に隠居勢とか。

間違ってる人を見て真似しちゃう可能性もあるのでこの機会に併せて書いておくことにしました。
これからのグローバルな社会を生きていく日本国のニンゲンなら自分の国のことは間違えないで?

(´・ω・`)日本万歳

0 件のコメント:

コメントを投稿

路線の「各駅待機状況表示」の改良について考える #その4

 フォーラムに新たに報告されたバグに対応したり 色々平行作業したり躓いたりあったけど、とりあえず進捗状況(´・ω・`) 本当はExtendedに提出しないでおこうと思っていた機能を、ある程度は提出することにした。 理由は (1) Extended バージョン15.0のために、UI...