Character Model for the World Wide Web 1.0: Fundamentals の公開について (W3C 勧告)

著者と公開日

出版日:

Web 上での文字の取扱いに関する統一的な手法を提示

 

http://www.w3.org/ — 2005年2月15日 — World Wide Web Consortium (W3C) は、Web における文字の取扱いに関する原則 Character Model for the World Wide Web 1.0: FundamentalsW3C 勧告として公開いたしました。十分な合意の下に、Web アプリケーションが世界中の言語の文字を送受信あるいは処理する方法が明確化されました。

本勧告は、Web 上での相互運用可能なテキスト操作について、技術仕様の設計者やソフトウェア開発者、コンテンツ制作者らが共有すべき指針となります。また本勧告は、Unicode Standard 及び ISO/IEC 10646 によって定義される Universal Character Set に基づいており、文字 (character)、符号化 (encoding)、文字列 (string) といった用語の使用、参照処理モデル、文字符号化の選択と識別、文字のエスケープ、文字列中での符号位置といった項目が取り上げられています。

本勧告の目標は、W3C が掲げるユニバーサルアクセスの実現という目標に呼応し、言語や用字、書記体系、文化的な慣習に関係なく、世界中の全ての人々が容易に Web を利用できるようにすることに他なりません。

Web に対応した Universal Character Set である Unicode

本勧告では Universal Character Set がその根幹を成しています。本勧告を採用することで、様々なプラットフォーム上で世界中の用字に基づくテキストを取り扱える Web 技術が実現し、世界中の Web 利用者がそれらのテキストを自由に交換し、読み、検索することが可能になります。テキストの符号化とは独立に文字を参照する方法を提供していること、十分な検討に基づいて更新、策定されていること、業界により広範に受け入れられ、実装されていること、などを理由に Unicode が採用されました。

W3C では、Unicode を文書文字集合として HTML 4.0 より採用しています。その後、XML 1.0 や CSS Level 2 といった W3C 勧告でも同様に採用されています。現在 W3C の仕様やアプリケーションでは、共通規範文字集合として Unicode を利用しています。

Web 上での文字の取扱いを明確化する新仕様

Web アプリケーション数が増加するにつれ、文字の取扱い方法を共有する必要性はますます重要になっています。特にアプリケーション開発者がアプリケーションにおける符号化を統一しようとする際に、そのような文字の取扱い方法を共有する基盤として Unicode を選択するのは自然な流れです。しかしながら、Web 上で Unicode を利用するにはさらなる技術仕様が必要となります。この要求を満たすのが W3C の Character Model 仕様群です。

本仕様群では、Web に特有な次の項目に対し、より詳細な説明が行われています。

  • UTF-8UTF-16UTF-32 といった Unicode 符号化形式の選択
  • 可変長文字符号や結合文字が含まれる場合の文字の数え方や文字列の長さの測り方
  • 事前合成文字や分解文字に伴う文字の重複符号化
  • 文字のエスケープ

2005年中の策定完了を目指す Character Model 仕様群

本日公開された Character Model for the World Wide Web 1.0: Fundamentals は、3部作となる Character Model 仕様群で最初の勧告となります。テキスト操作における文字列の同一性や事前統一正規化を規定する Character Model for the World Wide Web 1.0: Normalization と、IRI 利用規定となる Character Model for the World Wide Web 1.0: Resource Identifiers がそれぞれ鋭意策定中です。

Character Model 仕様群の策定において鍵を握る業界リーダ

本勧告は、W3C 国際化活動内にそれぞれ設置されている国際化インタレストグループと国際化コアワーキンググループの協調により、策定されました。本ワーキンググループには、BBC、Boeing、Ecole Mohammadia d'Ingénieurs、IBM、Microsoft、Siemens、Sun Microsystems、webMethods の各 W3C 会員が参加しています。

World Wide Web Consortium [W3C] について

W3C は、Web の発展と相互運用性を確保するための共通のプロトコルを開発することにより、Web の可能性を最大限に引き出すべく設立されました。W3C は、アメリカ合衆国マサチューセッツ工科大学計算機科学人工知能研究所 (MIT CSAIL)、フランスに本部を置く欧州情報処理数学研究コンソーシアム (ERCIM)、及び日本の慶應義塾大学がホスト機関として共同運営にあたっている国際産業コンソーシアムです。コンソーシアムにより提供されるサービスには、開発者及び利用者のための World Wide Web に関する豊富な情報、新技術を応用した様々なプロトタイプやサンプルアプリケーションの開発などが挙げられます。現在までに、350を超える組織がコンソーシアムの会員となっています。詳しくは W3C の Web サイト http://www.w3.org/ をご参照下さい。

 

お問合せ先 (アメリカ、オーストラリア)
Janet Daly, <janet@w3.org>, +1.617.253.5884
お問合せ先 (ヨーロッパ、アフリカ、中東)
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
お問合せ先 (アジア)
平川 泰之, <chibao@w3.org>, +81.466.49.1170

関連RSSフィード