Google
ブログ(iiyu.asablo.jpの検索)
ホットコーナー内の検索
 でもASAHIネット(asahi-net.or.jp)全体の検索です。
 検索したい言葉のあとに、空白で区切ってki4s-nkmrを入れるといいかも。
 例 中村(show) ki4s-nkmr

ウェブ全体の検索

日本語ソート、日本語照合順番、和暦、陰暦。旧暦、南北朝、日本語組版2011年01月14日 03時12分57秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 草野君が、
http://twitter.com/t2y/status/22973301831761920
日本語の正しいソートって何だ?を議論してる、単語の漢字をひらがなにして
ソートしたいとか、日本語と英語が得意な人は教えてあげて! / Japanese
Text Sort Order
http://bit.ly/gHqG93
をリツイートしていたので、返事した。

http://twitter.com/shownakamura/status/22994172881408000
@t2y ソフトヴィジョンのDBProで日本語照合順番を作りました。それはその後、
JIS規格にもつながっています。JIS X 4061:1996で検索してみてください。

 返事が返ってきた。
http://twitter.com/t2y/statuses/23025249561870337
JIS X 4061:1996 という規格があるよと伝えました
http://bit.ly/e2aiDA
ありがとうございます! RT @shownakamura: @t2y ソフトヴィジョンのDBPro
で日本語照合順番を作りました。それはその後、JIS規格にもつながっていま


 ということで、少し。

 まず、日本語ソート、日本語照合順番のことを。
 ソフトヴィジョンにあるDBProのオンラインマニュアルから。

http://www.softvision.co.jp/dbpro/help/function/strspell.htm
#基本つづり文字列(<文字列>)
http://www.softvision.co.jp/dbpro/help/index/termka.htm#kihon-tuzuri-hikaku
基本つづり比較
http://www.softvision.co.jp/dbpro/help/guide/jishoord.htm
辞書順
http://www.softvision.co.jp/dbpro/help/guide/jishoord.htm#jishocmp
文字列比較について

 日本語ソートからは脱線するが、
http://www.softvision.co.jp/dbpro/help/function/index.htm
DBPro 組込み関数一覧
をみると、面白いでしょ。
 たとえば、
http://www.softvision.co.jp/dbpro/help/function/lunardat.htm
#陰暦(<元号>, <整数年>, <整数月>, <整数日>)
なんて、すごいでしょ。
 DBProの日付書式
http://www.softvision.co.jp/dbpro/help/guide/format.htm#date
日付書式
もすごいでしょ。
--- ここから ---
平成,元号
 日付を現代和暦で表現することを指定し,元号として 平成,昭和,大正,
明治 を付加します。明治5年以前は 西暦 または 紀元前 になります。この機
能文字に続けて和暦年を指定する rr などを書かなかった場合,日付データが
属している元号だけが表示されます。平成 と書いても 元号 と書いても同じ
意味です。

陰暦
 日付を陰暦の通年表示(月日を陰暦とし,年は西暦と同じにする表現。元旦
前後の年は西暦とはずれる。)で表現することを指定し,陰暦 を付加します。
紀元前は負の年数表示になります。

旧暦
 日付を陰暦で表現し,その日の元号,または元号が定められていない場合に
は天皇(または皇后)の諡号が付加されます。現代和暦の場合と異なり,明治
6年のグレゴリオ暦採用以前についても元号が付加されます。南北朝時代につ
いては南朝の元号が付加されます。神武天皇以前については 陰暦 が付加され,
通年表示になります。この機能文字に続けて和暦年を指定する rr などを書か
なかった場合,日付データが属している元号だけが表示されます。

南朝北朝,舊北朝
 南北朝時代の日付についてだけ 旧暦 と同様に南朝または北朝の元号を付加
して表現します。南北朝以外の日付に対しては日付そのものを含めて何も表示
されません。
--- ここまで ---

 和暦、陰暦。旧暦、南北朝まで対応だもんね。
 世界のどこにも、こういうパソコンのデータベースソフトはなかった。いま
でもないでしょう。パソコン以外のデータベースでもないかもしれない。

http://www.softvision.co.jp/dbpro/help/index/termya.htm
用語集「や」のユリウス日
--- ここから ---
ユリウス日

DBProの日付型データはユリウス日で表現されています。
ユリウス日とは,紀元前4713年1月1日から数えた日数のことで,スカリゲル(J.
J.Scaliger)が考案し,主に天体観測に用いられています。紀元1599年以前は
ユリウス暦,1600年以降はグレゴリオ暦で計算されており,1582年10月5日か
ら14日までの10日間は存在しないため計算されません。
ユリウス暦(Julian calendar)とは,1年を365日として,4年に1度のうるう年
の追加を行なった暦のことで,紀元前46年にシーザー(Julius Caesar)が制定
しました。ちなみに当時のうるう日は2月24日の繰り返しでした。DBProでは,
うるう日は2月29日としています。
グレゴリオ暦(Gregorian calendar)とは,ユリウス暦に加えて400年に3度のう
るう年の削除を行なった暦のことで,ローマ教皇グレゴリウス13世(Gregory
XIII)が1582年10月15日に採用しました。その前日は10月4日でした。英国では,
1752年9月3日を9月14日としました。日本は,1872年(明治5年)12月3日を1873
年1月1日としました。
DBProで求まるユリウス日を実際に天体観測等に応用するには,日本標準時を
グリニッジ標準時に変換することと,時刻を小数点以下の値として加味する必
要があります。
--- ここまで ---

 以前も書いたが、暦を定めるのは、絶対権力者の特権だった。だから、天下
を取ったら、新しい暦を制定したりする。

関連:
http://iiyu.asablo.jp/blog/2007/05/16/1510350
シリーズ現代の天文学 岡村定矩編「人類の住む宇宙」

 JIS漢字の改訂、日本語照合順番や日本語組版のJIS化を主導した芝野耕司さ
んとは、日経MIXで知り合った。
 芝野さんは、日本語情報処理の基準になる規格が不足していることに大きな
問題意識を持っていた。日本語ソートの基準になる照合順番の規格がないこと
も気にしていて、ソフトヴィジョンで、酒井社長、石野さんなど我々が日本語
ソートをやっていることも知っていて、直接の実装には、おれは関わっていな
いが、芝野さんとは、あれこれ話もした。というより、色々、教わった。
 DBProの日本語ソートを作るときには、あれこれ調べたら、たとえば国語辞
典、電話帳では、並び順が違う。どうすればいいのかという話になって、国立
国語研究所まで話を聞きに行ったりしたのも懐かしい思い出だ。

 芝野さんは、いま、東京外国語大学(東京外大)なので、そこに紹介がある。
http://www.tufs.ac.jp/research/people/shibano_kohji.html
--- ここから ---
{日本語情報処理} マルチメディアへの関心から通産省のSGML懇談会の設置を
提案し,代表幹事を務めた。このことから電子文書処理,特に,日本語文書処理
に関する標準の不在の問題を痛感し,一連の日本語情報処理関係のJISの開発を
提案した。開発したJISは,日本語組版関係のJIS X 4051及びJIS X 4052並びに
日本語照合順番JIS X 4061及びJIS X 4062仮名漢字変換辞書交換形式,JIS X
4063仮名漢字変換ローマ字入力方式などがある。特に,日本語組版は,MS Word
などのほとんどのワープロやDTPで用いられているほか,W3Cでのルビ仕様にも
大きな影響を与えた。
--- ここまで ---

 改訂したJIS漢字については、JISの公式の規格書とは別に、JIS漢字字典と
いう辞典が出ている。
http://www.asahi-net.or.jp/~ki4s-nkmr/wabijo07.html
乳の詫び状(1997/12/08)から
--- ここから ---
 ついでにいうと、芝野耕司編著「JIS漢字字典」(日本規格協会)は、コンピ
ュータ屋は無条件ソッコー買いです。あるいはワープロ漢字辞典の類がほしい
人にもほぼソッコー買いでしょう。
--- ここまで ---

http://www.amazon.co.jp/exec/obidos/ASIN/4542201279/showshotcorne-22/
JIS漢字字典 [単行本]
芝野 耕司 (著)
 おれが持っているのは、1997年の初版だが、増補改訂版版が2002年に出てい
るのね。
http://www.amazon.co.jp/exec/obidos/ASIN/4542201295/showshotcorne-22/
JIS漢字字典 [単行本]
芝野 耕司 (著)

 コンピュータで日本語を情報処理する人は、手元にあるといい。漢字コード
表や技術的な話だけではなく、改訂の苦労や漢字にまつわるエピソードも載っ
ている。

 JIS漢字の改訂については、
http://internet.watch.impress.co.jp/www/column/ogata/index.htm
小形克宏の「文字の海、ビットの舟」
―― 文字コードが私たちに問いかけるもの
が、大変な労作。一読してみるといい。
 そうそう、JIS X 3005のSQLも芝野さんだったね。

 余談をひとつ。
 JISの規格書には、規格化作業に携わったメンバーの名前が載る。大体、日
本電信電話公社や、いまのNTT、日立、NEC、富士通などの大企業の部長クラス
などの人の名前が出ることが多い。他分野は知らないが、情報処理の分野では、
名前が載っている人の多くは、実際には作業をしてない人だという。
 おれも、芝野さんがやっていたあるJISの規格作りの時に会合に出ていたが、
最初の会合には各社のお偉いさんが来て、顔合わせと名刺交換などするが、以
後の会合は若い人が来る。そして最後の会合にだけ、また、お偉いさんが来る。
 実際に作業をするのは、若い社員。そして名誉だけお偉いさんが持って行く。
後述のように関西から若い人が東京までやってきて作業して、宿題を日帰りで
持ち帰ってまた作業するという状態。この若い人は実作業をしているのに、報
われない。
 芝野さんは、こういう悪しき慣習を嫌がっていた。
 だから、芝野さんがやったJISの規格は、実際に作業した人の名前が載って
いると思う。確認はしていないが。

関連:
http://iiyu.asablo.jp/blog/2009/06/04/4341671
SQLの解説書、REXXのこともちょびっと。
http://iiyu.asablo.jp/blog/2010/07/16/5220523
EPUBやCSSと日本語レイアウト、HTML5と電子書籍

 ここから日本語組版の話。
 ソフトヴィジョンからアンテナハウスに移ったあとも、特に石野さんたちは、
日本語組版に関わっていて、小林社長も理解があるので、組版の規格作りなど
にもアンテナハウスは関わっている。
 規格作りはボランティア、無報酬、手弁当の世界。というより、持ち出しの
世界。金儲け主義でやっていたら、やってられない世界。
 前述のJISの規格作業では、関西のメーカーから若い人が日帰りでやってき
て、帰って行くのが通例。だから、終わったら一杯飲みましょうといっても、
それは、なかなかかなわない。専門家を呼んで意見を聞く場合も、金がないか
ら謝礼が出せない。なんとか交通費だけでも捻出して渡すという世界。
 地味な作業なので、光が当たらず、世間は知らないので、感謝されることも
ない。
 でも、社会が少しでもよくなるのに役立つだろう。日本および日本語の情報
処理に役立つだろうと、関係者のみなさん、地道かつ熱心にやっている。
 役立っている例のひとつが、JIS X 4051のアルゴリズムが、Microsoft Word
やAdobe InDesignに使われていること。これで、外国のソフトがかなりまとも
な日本語組版ができるようになったのがわかる。
 もちろん、アンテナハウスのAH Formatterも対応しているが、JIS X 4051だ
けでは日本語組版に足りない部分があり、AH Formatterでは拡張もしている。
それについては、後述。

http://www.antenna.co.jp/AHF/
AH Formatter

http://journal.mycom.co.jp/news/2010/08/10/011/index.html
アンテナハウス、XMLベースの組版ソフト「AH Formatter」の新版リリース

 海外でも売っている。
http://www.antennahouse.com/product/ahf50/ahf5top.htm
AH Formatter

 海外では、大変、高い評価を頂戴していて、欧米の、へええと思うような巨
大グローバル企業にも採用されている。中国でも、まあ、そう。これも以前か
ら書いているが、DITAの活用もそうだが、日本企業は遅れていると思うことが
しばしば。
 エクスイズムでは、AH Formatterを使った電子文書、電子書籍作成をお手伝
いするサービスを行なっている。興味があれば、問い合わせてみてほしい。
http://www.exism.co.jp/service/list/list.html
データ(情報)に付加価値をつけるXML技術とデジタル化支援サービス

 AH Formatterの拡張については、
http://www.antenna.co.jp/ml/back/OOXMLBK/OOXMLBK.html
XSL-FO による書籍の自動組版
2007年11月 アンテナハウス(株) 石野恵一郎
http://www.antenna.co.jp/ml/back/OOXMLBK/OOXMLBK-A4.pdf
XSL-FO による書籍の自動組版
2007年11月 アンテナハウス(株) 石野恵一郎
http://www.hi-ho.ne.jp/y-komachi/committees/vma/confs/vma15/15-1.pdf
縦組文書における数字の表記方法
(コンピュータ組版に残された課題のひとつとして)
長村 玄
などを参照。

 XSL-FO, CSSの日本語組版も以前から懸念されいる。
 アンテンハウス小林社長のブログから。
http://blog.antenna.co.jp/PDFTool/archives/2007/02/20/#a000603
PDF 千夜一夜
2007年02月20日
第22回多言語組版研究会 「縦組の組版方法と組版指定交換形式」を開催しました
--- ここから ---
XSL-FOのワーキング・グループで仕様を決めている人たちは、日本語組版を綺
麗に行うための要求条件について、ほとんど知識をもっていないようです。
CSSのワーキング・グループも、ほとんど同じような状況で、現在、W3Cで進め
られているCSS3のドラフト仕様にも、相当におかしな日本語組版の仕様やサン
プルが掲載されています。

特に、CSS3の仕様を作っている人達の間では「日本語組版はグリッドベースで
行う」、という思い込みがあるようで、ページを縦横の升目に区切ってその升
目に文字を配置するというような仕様案が掲載されています。

これは、恐らくは、Microsoft Wordで、文字をグリッドに合わせて配置すると
いうページ設定のモードがあり、このモードに基づいているのではなかろうか
と思われるのですが、あまり頂けません。

もっとも望ましいのは、JIS X4051を完全に英語に翻訳して提供することでは
ないかと思いますが、残念ながら、JIS X4051の公式な英訳は存在しません。
特にCSS3の仕様などは、将来的には、ブラウザなどに実装され、日本人がWeb
で文章を読む際に、大きな影響を与える可能性が大きいと思います。

日本からの積極的な情報提供や発言が望まれます。
--- ここまで ---

 W3Cに対しては、
http://www.w3.org/TR/jlreq/
Requirements for Japanese Text Layout
W3C Working Group Note 4 June 2009
にあるように、提案もしている。

関連:
http://iiyu.asablo.jp/blog/2010/06/10/5150986
CSS3で縦書き、EPUB日本語組版拡張試案

 以下、その他、参考。
http://sigdd.sakura.ne.jp/index.php?title=%E7%AC%AC72%E5%9B%9E%E7%A0%94%E7%A9%B6%E4%BC%9A
◆第72回デジタルドキュメント研究会
(8) 16:50 - 17:20
多言語による共同執筆および出版環境に関する一考察
○石野恵一郎(株式会社アンテナハウス)・山口琢(株式会社ジャストシステ
ム)・小林龍生(ジャストシステムデジタル文化研究所)
概要:
This paper introduces an implementation of a multilingual,
collaborative document editing and publication environment. The
purpose
is to provide a low bar for learning new editing techniques, but
keeping flexibility for e.g. creating various outputs and using
various
data sources in the processing chain. The implementation described
here
is project specific, but we will draw general conclusions hopefully of
use for similar efforts.

http://www.jagat.or.jp/story_memo_view.asp?StoryID=11791
スタイルシート技術による書籍自動組版

 あ、これに関連して、スラッシュドットジャパン(スラドJ)でのことや、ウ
ェブマガジンの誠Biz.ID編集長の鷹木創がバカなことを書いていたことを思い
出した。カモリーマン雑誌のカモリーマン編集か、こいつは、と思ったね。
 もう1年くらい前になるのか。暇があれば書いてもいいが、カモリーマン向
けウェブマガジンのバカ編集長を叩いてもねえ。とはいえ、あの辺のレベルが
低すぎるから、日本再生なんていってもお笑いにしかならない。
 ちょっとだけ書くと、アンテナハウスとはPDF製品のライバルだったクセロ
が倒産して、アンテンハウスが社員を引き取って、名古屋支店を作った。その
後、無料でばらまいていたクセロのPDFのソフトを有料化した。
 すると、鷹木創が金儲け主義だといって、メルマガで批判した。
 バカか、こいつは。金儲け主義で、どうして、ライバル社の社員が路頭に迷
わないように、わざわざ名古屋支店まで作るのだ。金儲け主義で、どうして、
前述のように持ち出しになる地味な規格化作業に社員を動員するのだ。
 小林社長は、リストラせずにかんばるタイプ、いわば古いタイプの経営者だが、
ライバル社の社員まで面倒をみるのは、金儲け主義じゃ、なかなかできない。
 批判を書いた鷹木創は、もちろん、アンテナハウスへの取材なし。経緯を調
べた形跡もないし、知識も洞察力もなし。そんなバカが文章を書く。だから、
こんな奴はメディアの側にいてはいけないのだ。それがメディアの編集長をや
っている。ウェブマガジンのレベルの低さがわかろうというもの。
 スラドJでも、クセロのPDF製品を有料化したことで、おれの名前を出し、中
村正三郎は、オープンソースを語る資格がないなどと書いたバカがいた。
 オープンソースのエコシステムがどうなっているかも知らず、このバカも鷹
木創と同じく、あるのは、タダでくれくれ君の乞食根性。他力本願、他人頼み
であって、自分の足で立って前に歩いていく気がない連中。
 こんなのがうじゃうじゃいたら、日本再生なんてあるわけがない。
 スラドJにもこんなバカがいるのかと思ったが、一方で、同じ週には、たし
か、日本語組版のJIS化にアンテナハウスが関わっていたことをほめてくださ
った人もいた。さすがは、スラドJ。わかる人はわかっていると思った。
 こういう人がうじゃうじゃいれば、日本再生なんて楽勝。
 あれ? 鷹木創とスラドJに関することはほとんど書いちゃったか。
 あと書きたかったのは、鷹木創の件から、パソコン雑誌の編集長、編集者、
ウェブマガジンの編集長、編集者およびライターの知的水準の低さだったが、
それはそれこそ、股の機械に。たぶん、巡ってこないだろうが。

 あ、
http://iiyu.asablo.jp/blog/2009/02/23/4137096
グーグルが金を払ってブロガーに書かせていた
に、鷹木創が出てくる。
--- ここから ---
これ、典型的なマーケ屋が書いた文章ね。
鷹木創というライターが書いたことになってるけど、ペンネームっぽい名前だ
な。
(略)
無理やり感があって、記事全体も臭くてね。
--- ここまで ---
などと書いている。問題のメルマガの文章の1年くらい前から、そうだと知ら
ずにダメな奴だと思っていたんだね。

関連:
http://iiyu.asablo.jp/blog/2010/04/30/5052699
日本の報道機関の恥部。記者クラブ問題、警察、検察の裏金作り
http://iiyu.asablo.jp/blog/2010/06/17/5167681
PDFに関連する何でも情報・参考資料

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
一富士、二鷹、三は? ひらがなで。

コメント:

トラックバック

_ ホットコーナーの舞台裏 - 2011年02月14日 01時44分47秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 ZAKZAK、ビジネスメディア誠に、大相撲の八百長に関して、おれのパ

_ ホットコーナーの舞台裏 - 2011年04月09日 22時27分55秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
http://iiyu.asablo.jp/blog/2011/03/23/5754573
ユリイカ2011年2月号ソーシャルネッ

_ ホットコーナーの舞台裏 - 2011年08月08日 09時34分36秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 iPad用康煕字典のことを書いて思い出した。

 論語の本のリストを

_ ホットコーナーの舞台裏 - 2011年08月15日 23時47分58秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 自社のブログながら、
http://blog.antenna.co.jp/CSSPage/
CSS組版ブログ
EPUB

_ ホットコーナーの舞台裏 - 2012年05月24日 04時28分03秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 リンクのみで失礼。

http://itpro.nikkeibp.co.jp/article/COLUMN/20120517/397208/

_ ホットコーナーの舞台裏 - 2013年03月17日 09時20分11秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
l パソコンの液晶モニタから出るブルーライトが体に悪いから、それ

_ ホットコーナーの舞台裏 - 2014年02月07日 07時04分27秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 もうわざわざ書かんでも、いいやろうと思って、なかなか書かなか

_ ホットコーナーの舞台裏 - 2014年09月05日 10時23分21秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。
---
 お買い上げありがとうございます。
 こんな辞典があるんですね。