今月末のSSL仕様変更対応に使えるソフトバンクのウェブコード形式の絵文字をUnicode形式に変換するためのPHPデータ

2011/6/17 金曜日 Posted in PHP, SoftBank | No Comments »

昨日に続き、今月末の6月30日に実施される予定となっているソフトバンクのSSL仕様変更絡みのネタです。 変更の内容や対処方法は、昨日の記事をご覧ください。   変更の内容の中に、ウェブコードで書かれた絵文字が表示できなくなるというものがあります。 ちょうど私もソフトバンクの絵文字をいじる用事があったので、変換用のPHP配列データを作ってみました。 → SoftBankWebcode2Unicode.text [ke-tai.org]   '・$G!・' => '', '・$G"・' => '',   ・   ・   ・ のように、連想配列を並べただけです。   $arr['ウェブコード文字列'] のようにして変換が可能です。 ※変換プログラムではなくただの配列ですので、適当に変換コードを書いてご利用ください。   なお、元データにはText_Pictogram_MobileのJsonファイルを使用させていただいております。ありがとうございます。   関連: ソフトバンクの絵文字情報ページから、ウェブコードの表記が消えたようです 2011年2月に予定されていたソフトバンクのSSL仕様変更が6月末に延期になったようです 2011年2月に行われるYahoo!ケータイのSSL仕様変更への対処法がまとめられた記事「SoftBank SSL仕様変更への対処まとめ」 Read more..

「Unicode 6.0」に絵文字が正式されたようです

2010/10/13 水曜日 Posted in ニュース, 記事紹介・リンク | No Comments »

以前からUnicodeに絵文字が入るという話がありましたが、「Unicode 6.0」でとうとうそれが実現したようです。   本家のリリース記事はこちら。 → Unicode 6.0: Support for Popular Symbols in Asia [unicode.org]   わかりやすい日本語の記事はこちら。 → ケータイWatch 「Unicode 6.0」が策定、絵文字が国際標準に [k-tai.impress.co.jp]   「Unicode 6.0: Support for Popular Symbols in Asia」ということなので、おそらく日本の絵文字を強く意識したものだと思います。 上記記事内には、絵文字表の画像が貼られていたので少し見てみましたが、見慣れた文字も多いのですが、国内ケータイキャリアのものとは少し違っているようで、中国人やインド人の絵文字など、どうも微妙なものも多く含まれているようです(笑)   関連: Rubyでemoji4Unicodeのデータを使って絵文字を変換するgem「e4u-encode」 Googleのemoji4unicodeをベースにした絵文字変換Perlモジュール「Encode::JP::Emoji」 Googleが絵文字のユニコード符号化を提案しているようです Read more..

Googleの絵文字符号化プロジェクトについて詳しく解説されたコラム「絵文字が開いてしまったパンドラの箱(第2回)」

2009/3/9 月曜日 Posted in 記事紹介・リンク | No Comments »

先日ご紹介したCNET Japanで連載中のコラム「絵文字が開いてしまったパンドラの箱」ですが、早くも第2回が掲載されているようです。   → CNET Japan 絵文字が開いてしまった「パンドラの箱」第2回 - Googleの開けてしまった箱の中味 [japan.cnet.com]   今回の第2回は「Googleの開けてしまった箱の中味」と題して、Googleの絵文字符号化プロジェクトについて詳しく述べられています。   ケータイサイトを作成しているプログラマであれば、誰もがキャリアごとに異なる絵文字に悩まされた経験があるはずです。 Googleのプロジェクトでは、それをUnicode収録というアプローチで解決しようとしています。   今回のコラムでは、このプロジェクトに対するドコモへのQAや、Unicodeの基本的な仕組み、なぜGoogleはUnicode符号化を進めようとしているのか、まで詳しく述べられています。 技術的にも興味深いですし、読みやすく面白い記事でオススメです。 第3回はあるのでしょうか。楽しみです。   関連: 絵文字のおかれた状況がよくわかるコラム「絵文字が開いてしまったパンドラの箱」 Googleが絵文字のユニコード符号化を提案しているようです ウノウラボに絵文字と文字コードについて詳しく解説した資料「文字コードと携帯絵文字」が公開されています Read more..

Googleが絵文字のユニコード符号化を提案しているようです

2008/11/27 木曜日 Posted in ニュース | 2 Comments »

Google Japan Blogにケータイに関連する興味深い記事がありましたのでご紹介します。 Googleが日本国内のケータイ絵文字をユニコードの文字として符号化するよう提案しているようです。 → Google Japan Blog 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ [googlejapan.blogspot.com]   なんだか一見難解でよくわからない内容ですが、こちらのブログがわかりやすく解説してくれています。 → Cafe Babe 携帯の絵文字のUnicodeへの収録 [d.hatena.ne.jp]   つまり、まとめるとこういうことでしょうか。 日本のケータイ絵文字をユニコードとして共通符号化し、収録したいと考えている 既存の絵文字に関しては、キャリア間のマッピング定義で対応する 収録対象・マッピング・変換表はオープンソースプロジェクトとして公開してあるので、フィードバックをよろしく ※もし間違っていたらご指摘をお願いします。   各種コードやデータはこちらにおいてあるそうです。 → Google 文字ユニコード符号化プロジェクトページ [sites.google.com] → Google Code 絵文字オープンソース・データページ emoji4unicode [code.google.com]   各キャリア間で絵文字が異なるのは、ケータイサイトを作る上で最大の障壁でした。 今までもコンバートすることは可能だったのですが、利用するライブラリによって変換表がまちまちで、私が以前携わっていたプロジェクトでも、ドコモやauで男女マークを出していたつもりが、ソフトバンクでは便器が表示されてしまうという事態になったことがあります(笑) この辺りが統一されるのは非常に嬉しい流れですね。 キャリア側がどのように対応していくのかも気になるところです。   追記: CNET Japanに関連記事が掲載されました。 → CNET Japan グーグル、絵文字を標準化へ - オープンソースプロジェクト開始   関連: iPhone3Gが絵文字に対応したようなので早速試してみました ドコモ公式サイトに絵文字変換対応表が公開されています PHPで絵文字を壊さずに文字コードや全角半角変換を行う方法 Read more..