フォーラムのユーザ登録時のメールについて
-
本日、本フォーラムに参加させていただきました。
ユーザ登録メールが届いたのですが、Charsetが指定されていない+From/Subjectが適切にエンコードされていないため、かなり文字化けを起こしています。ヘッダだけ見れば適切に見えますが、メールソフトによっては何が何だかさっぱり
な状況になるかもしれません。こういう不具合は日本語化チームで対応可能でしょうか?
To: xxxxx@xxxxxxx
Subject: フォーラム: パスワード
From: “フォーラム” <xxxxxx@xxxxxxxxx>
Message-Id: <20080410223307.40300135C399@xxxxxxxxxxxx>
Date: Thu, 10 Apr 2008 22:33:07 +0000 (UTC)
-
ヘッダだけ見れば適切に見えますが、メールソフトによっては何が何だかさっぱりな状況になるかもしれません。
記述されたメールヘッダは、メールソフトが整形したものなので、生のメールヘッダをここに書いてみると、解決に近づくかもしれません。やばい部分は XXX と伏せ字でいいと思いますし。
登録システムとしては、英語フォーラムと兼用なので、完全な日本語化は厳しいかも??
一応生のメールヘッダなのですが、、、
サーバの経由情報等は特にいらないので、それ以外の情報全てが前述のしかありませんでした。すべて記述すると(サーバ上に残っていないため別メールで登録させていただきました)
以下のとおりですが、Content-TypeがないのとFrom/Subjectがおかしいと怒られてるのがわかると思います。Return-Path: <nobody@xxxxxxxx>
Delivered-To: xxxxxxxxxx@xxxxxxx
Received: (qmail 10302 invoked by uid 5442); 12 Apr 2008 23:41:28 +0900
DomainKey-Status: no signature
Received: from 72.233.xx.xxx by xxxxxx (envelope-from <nobody@xxxxxxxxxxxxxx>, uid 89) with qmail-scanner-2.02st
(spamassassin: 3.2.4. perlscan: 2.02st.
Clear:RC:0(72.233.56.133):SA:0(6.4/13.0):.
Processed in 6.785939 secs); 12 Apr 2008 23:41:28 +0900
X-Spam-Status: No, hits=6.4 required=13.0
X-Spam-Level: ++++++
X-Spam-Report: SA TESTS
0.1 ARIN Mail from ARIN area (USA)
2.9 FROM_ILLEGAL_CHARS From: has too many raw illegal characters
1.0 SUBJ_ILLEGAL_CHARS Subject: has too many raw illegal characters
0.0 BAYES_50 BODY: Bayesian spam probability is 40 to 60%
[score: 0.4179]
2.2 TVD_SPACE_RATIO BODY: TVD_SPACE_RATIO
0.1 RDNS_NONE Delivered to trusted network by a host with no rDNS
0.2 NOTINCONTENTTYPE ! There’s no Content-Type header
-0.1 AWL AWL: From: address is in the auto white-list
Received: from unknown (HELO xxxxxxxxxxxx) (72.233.xxxxx)
by 0 with SMTP; 12 Apr 2008 23:41:21 +0900
Received-SPF: pass (0: SPF record at wordpress.org designates 72.233.xxxxx as permitted sender)
Received: by xxxxxxxxxx (Postfix, from userid 65534)
id 9BAC0135C236; Sat, 12 Apr 2008 14:41:19 +0000 (UTC)
To: xxxxxxxxx@xxxxxxxxxx
Subject: フォーラム: パスワード
From: “フォーラム” <xxxxxx@xxxxxxxx>
Message-Id: <20080412144119.9BAC0135C236@xxxxxxxxxx>
Date: Sat, 12 Apr 2008 14:41:19 +0000 (UTC)一応生のメールヘッダなのですが、、、
ありゃりゃ。そうでしたか。Subject や From フィールドに、UTF-8 文字列 (ないし ISO-2022-JP 文字列) を直に埋め込んであったということですか?? その場合は「生 UTF-8」「生JIS」と書いて頂けると、より分かりやすかったです (「適切にエンコードされてない」は間違ってないのですが、ISO-8859-1 で MIME-Q しているとか、勘違いしていました)。
わざわざ登録作業をやり直されたというのはお手数をおかけしました。
となると、バイト並びがどうなっているかが重要になってきますね。そうなると、日本語チームに登録通知メールをそのまま転送する方がいいかもしれません。というか、日本語化チームがテスト登録すればいいだけかも。
ご返信ありがとうございます。
(寝ぼけ眼なので文章が変になっているかもしれません)ヘッダを含めた全ての文字列が生UTF-8で記述されているということです。(私も省略しすぎてしまっていて誤解を与えてしまうような発言となってしまっていたことをお詫びします)
私のメールソフト(Becky)のせいかもしれませんが、デフォルトでiso-2022-jpで読もうとするため、メール本文まで文字化けしてしまっていました。
(UTF-8で読み直すと本文のみ正常に表示されます)
メール自体がUTF-8なのは別に問題ではない(*)と思っていますので、
Content-Type: text/plain; charset=UTF-8
位はメールヘッダに追加しても良いのでは?と思った次第です。(*)MIMEエンコードや8bit問題は別として、メーラで本文が文字化けせずに表示されるかされないかだけですが
メール自体がUTF-8なのは別に問題ではない(*)と思っていますので、
本文はともかく、From, To, Subject フィールドに UTF-8 をそのまま入れるのは、まずいでしょう。MIME 規格違反だと思われます。(RFC2822 違反ではなさそうですが)。
本文に UTF-8 を使っていいかも、まだ議論が分かれています。まだ、RFC146 (日本語訳) が有効で、これを積極的に裏返す (日本語メールで UTF-8 を推奨する) ような提案は出ていませんから。
個人的には、「そろそろ日本語メールも UTF-8 でええやん」と思いますが、携帯メールを始めとして対応していない場合が多いので、2008年とはいえ、時期尚早かもしれません。
RFCとかはあんまり詳しくなかったので拝見させて頂きました。
日本のUTF-8への対応は若干遅れてるなぁというのが個人的な感想ですね~。
日本以外でも公式のローカルページが出てくるかもしれませんので、登録メールの件については色々とご検討いただければと思います。
#特に問題等無ければ本レスにてクローズしていただいて構いません。#以下はスレ汚しかも知れませんが、流し読みしてもらえればと思います。RFC云々を特に意識していなかったころの話です
Elxis(Joomlaからの派生)というマイナーなCMSのローカライズをやっていて、メールの日本語化で現地(ギリシャ)の方と議論をしました。
私はメールについてiso-2022-jpで行きましょうと提案をしたのですが、
相手「完全なUTF-8を目指してるんだから日本語でiso-2022-jpなんて使うな」
相手「メールが文字化けしてないんだからUTF-8で良いじゃないか」
という結末になりました。。
私の語彙が少ないのも原因の一つだったかもしれませんが、海外のWebアプリではもうUTF-8が標準になりつつあるということも合わせて感じてしまいました。最後に。
長々とくだらない文章をつづって大変失礼いたしました。momo-iさん、lilyfanさん、ありがとうございます。
bbPress 0.9.0.1でも試してみましたが同じようですので、これはbbPress本体の問題ですね。となると、残念ながら設置担当者の方針のため、本体を修正してもらわない限りはこのフォーラムでも修正されません。
で、すみませんが、私はよくわからなくて上手く英語で説明できそうにないので、どなたかtracに報告してもらえませんでしょうか?
よろしくお願いします。
このアカウントのメールを受け取ったとき、メールの件名のみ文字化けしていました。
受信はMac Thunderbird1.0です。このアカウントを取る前に、別の名前で登録したのですが、メールが届いていません。
その名前で登録し直すと、not Validとなり、登録出来ませんでした。
もしかすると、文字化けが原因でスパムメールとして削除されているかもしれません。> 相手「メールが文字化けしてないんだからUTF-8で良いじゃないか」
特に英語圏の場合は昔から使われているlaten-1(キーボードに刻印されている英数記号)とUTF-8の間で100%の互換性がありますし、移行には問題はないと思いますが、
日本語や中国語のように様々な文字コードがあり、互換性のないコードでは、そう簡単に移行出来ないと思います。
とくに携帯では、Shift_JISでは1文字2バイト、UTF-8では3バイトとなり、
50文字送信するのに1パケットで済むか2パケット必要か、という問題もあると思いますし。で、すみませんが、私はよくわからなくて上手く英語で説明できそうにないので、どなたかtracに報告してもらえませんでしょうか?
ちょっと放置してしまいましたが、RFC2047 を根拠に提案すればいいと思いますので、何とかひねり出して投稿してみることにします。
bbPress の trac に投げたつもりでしたが、今探してみると見当たらないですね……。どうも忘れていたようです。今ちょっと忙しいので、来月以降作業してみます。
報告するとしたら、本文に UTF-8 を使うのは規格違反ではないが、メールヘッダ部分に UTF-8 をそのまま入れるのは MIME 規格違反なので、そこを修正してもらうということになります。
そして、別チケットとして、日本語圏には RFC1468 対応 (ISO-2022-JP での送信) をしてもらうということも提案してみます。
前者は必ず採用してもらわないといけませんが、後者は開発者の考えによっては没になるかもしれません。その場合は、UTF-8 に対応してないメーラー/ウェブメールサービスがヘボいということになります 😉
ベッキーですが、
サブジェクトとかだけ文字化けしていて、
本文は文字化けしていないので、
その対応でいいと思います現状でも、UTF-8でかかれていても、
本文部分であればキチンと表示されています。しかしUTF-8でサブジェクトとかを書かれると
文字化けするようです。ユーザ名、パスワードでforgetとありますがここで再発行したのですが
Win、OutlookExpressで受信しようとしたのですが再発行メールが化けているのはわかっていたのですが受信途中で止まるのでWebメールから確認してみると再発行メールが悪さしている
何度か止まるのを繰り返して受信できた、よってMIME 規格違反を修正して欲しいどなたか
ここのプログラムのここを こう直すと
メールのサブジェクトはUTF-8からISO-2022-JPになって
文字化けは直るよ。と教えていただけませんか?
あるいは、対策を説明しているURLでも助かるのですが・・・・こちらの掲示板からのloginのパスワードなどの案内メールも
ベッキーでは、文字化けします。
- トピック「フォーラムのユーザ登録時のメールについて」には新たに返信することはできません。