ジチテン

文字情報基盤

読み:もじじょうほうきばん

別名:MJ文字情報基盤
意味

文字情報基盤とは、行政事務で用いる人名漢字などの約6万文字を整理し、文字コードとフォントを国が標準として整備した文字環境である。

住民記録や戸籍の窓口では、システムごとに表示できる漢字の範囲が違うために、同じ氏名が文字化けしたり別字に置き換わったりする問題が長く続いてきた。文字情報基盤は、行政が扱う異体字を含む約6万文字をMJ文字図形リストとして体系化し、共通の文字コード(国際符号化文字集合に対応)とIPAmj明朝フォントで運用できるようにした基盤である。これにより、システムを更新したり他機関とデータをやり取りしたりしても、外字(システム固有に作り込んだ文字)に頼らず氏名表記を保てる。基幹業務システムの標準化では、各団体がばらばらに作ってきた外字を文字情報基盤の文字へ同定(マッピング)する作業が前提となり、移行の山場の一つになる。担当者にとっては、外字の棚卸しと同定が標準準拠システムへの移行可否を左右する点を押さえる必要がある。

外字同定が標準化移行の関門

標準準拠システムへの移行では、現行システムの外字を文字情報基盤の文字へ一字ずつ突き合わせる同定作業が必要になる。外字とは、戸籍などで使われてきた異体字をJISの標準文字集合になかったために各団体が独自に作字したもので、団体ごとに字形も登録番号も異なる。文字情報基盤は約6万字を整備し、各文字に固有の文字情報基盤識別番号を与えて、団体をまたいで同じ文字を同じ番号で指せるようにする。同定できない文字は代替表記や注記での運用を決めなければならず、外字数が多い団体ほど作業量が膨らむ。デジタル庁・IPAは同定支援のツールやマッピング表を提供しており、これを使って機械的に突合できる範囲を広げ、残りを人手で判断する進め方が現実的である。

つながりのある用語

ご意見箱(匿名でひとことから投稿できます)