Google
ブログ(iiyu.asablo.jpの検索)
ホットコーナー内の検索
 でもASAHIネット(asahi-net.or.jp)全体の検索です。
 検索したい言葉のあとに、空白で区切ってki4s-nkmrを入れるといいかも。
 例 中村(show) ki4s-nkmr

ウェブ全体の検索

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム。計量文献学、計量言語学、計算言語学、法言語学(Forensic linguistics)2018年04月07日 23時56分46秒

ASAHIネット(http://asahi-net.jp )のjouwa/salonから。
---
 コンピュータで、ベストセラーになるかどうか、判定できると主張する本のようです。
https://www.amazon.co.jp/exec/obidos/ASIN/4822251845/showshotcorne-22/
ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム 単行本 – 2017/3/23
ジョディ・アーチャー (著), マシュー・ジョッカーズ (著), 西内啓 (監修), 川添節子 (翻訳)
テキスト・マイニングと計量文献学の最新技術を駆使して読者を魅了する秘密のDNAを明らかにした、文学界騒然の注目作

 どの本だったか忘れたが、ワインがいい悪い、売れる売れないは、有名なワインの評論家ロバート・パーカーより、コンピュータのほうがよく当たる、予測精度が高いという話があった。
 機械学習とかディープラーニングとかそんなものではなく、割と簡単な数式一発だった記憶がある。

 計量言語学は、計算言語学に転送されますね。
https://ja.wikipedia.org/wiki/計量文献学
https://ja.wikipedia.org/wiki/計算言語学
https://en.wikipedia.org/wiki/Forensic_linguistics
法言語学(Forensic linguistics)
https://ja.wikipedia.org/wiki/プロジェクト・グーテンベルク

 欧米では、プロジェクト・グーテンベルクがあって、シェイクスピア作品は、大昔から電子テキスト化されて、盛んに文体解析が行なわれてきました。シェイクスピアの未発見原稿などというものが出てきたら、本物か贋作かを調べるとか、色々、行なわれているようです。
 筒井さんのように、作品毎に文体をまるで変えてしまう作家の場合、この文体は、この時期のこの作品と類似という具合に、かなり、ピンポイントじゃないと、筒井康隆文体に似ているかどうかは、判定できないでしょうね。
 ちなみに、私、「行う」は、送り仮名の本則である役所的推奨の書き方ではなく、「行なう」と、「な」を入れることが多いです。
 「行った(いった)」と「行った(おこなった)」を区別しやすいからです。
 だから、犯行声明文に「行なった」とあったら、それは中村正三郎の文体で、犯人はおれです。\(^O^)/
 なお、仮名漢字変換のATOKは、デフォルトは、本則ですが、送り仮名をどうするか設定できますね。
 証言や証拠の鑑定・分析をするのは、法言語学(Forensic linguistics)という世界だそうです。

 計量文献学、計量言語学、統計的テキスト解析のことは、
http://iiyu.asablo.jp/blog/2016/10/12/8222823
モナドの領域。筒井康隆+佐々木敦「なぜ「最後の長編」なのか?」
で書いてますね。
 そこに書いた参考。
https://ja.wikipedia.org/wiki/計量文献学
http://x51.org/x/03/11/1558.php
W・シェークスピアの謎、コンピュータが徹底解析へ
https://cakes.mu/posts/731
統計家たちの仁義なき争い (2)
——言葉を分析するテキストマイニング
計量文献学が否定した「シェイクスピア=フランシス・ベーコン説」
https://www1.doshisha.ac.jp/~mjin/R/56/56.html
統計的テキスト解析(1)~統計的データ解析とは?~
http://www.fun.ac.jp/~kimagure_ai/
きまぐれ人工知能プロジェクト作家ですのよ - 公立はこだて未来大学
http://www.asahi.com/articles/ASJ3P644GJ3PUCLV006.html
人工知能使った小説、1次審査通過 ただ8割方は人の手
板垣麻衣子2016年3月21日20時49分

 計量文体学の本もありますね。現代日本語の計量文体学の本もある。
https://www.amazon.co.jp/exec/obidos/ASIN/452330064X/showshotcorne-22/
文章の計量―文学研究のための計量文体学入門 単行本 – 1996/6
アンソニー・ケニィ (著), 吉岡 健一 (翻訳)
https://www.amazon.co.jp/exec/obidos/ASIN/4874245595/showshotcorne-22/
現代日本語の計量文体論 (日本語研究叢書26) 単行本(ソフトカバー) – 2012/8/20
陳 志文 (著)

■文体診断ロゴーンについて
 文体診断ロゴーンという、面白いサービスがあります。
 入力した文章と、著名作家など64人の文章と比較して、誰の文体に似ているかを診断してくれるサービスです。

http://logoon.org
文体診断λόγωνロゴーン
http://logoon.org/about.html
文体診断ロゴーンについて
http://logoon.org/about/shutten.html
テキストの一覧
の一覧をみると、著名作家の作品はもちろん、総理大臣の所信表明演説もありますね。

 自分のブログの文章をやってみた。\(^O^)/
http://iiyu.asablo.jp/blog/2018/03/22/8808719
日経サイエンス2018年5月号は、暗黒物質と、仮想通貨、ブロックチェーン特集。ちょびっとだけ野口悠紀雄たちのトンデモのことも
から、
--- ここから ---
 経済学者というより、売文芸者の野口悠紀雄が、ブロックチェーンを手放しで礼賛して、困ったもんだ。
 仮想通貨の交換所がクラッキングにあって、何百億円もなくなって、でも、悪いのは交換所でブロックチェーンは悪くないとか、ブロックチェーンで決済が担保されるとか、そんな都合がいい話ばかりじゃないぞと思うが、イケイケドンドンをばらまいている代表が、野口悠紀雄。
 お前、学者や物書きとして誠実さ、誠意がないね。そういう連中が跋扈しているから、日本の経済学、経済論壇、経済誌、ビジネス誌はだめで、そのせいもあって、失われた20年、30年になっているのにと思う。
 そのことは、また、詳しく書ける時間があればと思うが、次のツイートは、けっこうリツイートされた。高木さんがリツートしてくれたからだろう。
--- ここから ---
https://twitter.com/shownakamura/status/975875438403715078
経済学者の野口悠紀雄にも、そう言いたい。嘘や筋の悪いことを撒き散らしている。こんなのを持て囃すメディア、主にビジネス系、経済系メディアの見識のなさ。
https://twitter.com/HiromitsuTakagi/status/975404077059252224
--- ここから ---
基調講演に呼んだ張本人には、「こんなのを持て囃して社会を混乱させてはいけない」と即座に忠告しておいた。
--- ここまで ---
--- ここまで ---

 Javaは流行らなかったをはじめ、野口悠紀雄が書くものは、学者とは思えないほど嘘が多いんだよね。
 そんな嘘や筋の悪さに気づけない、ビジネス系、経済系メディアの編集部の知的レベルの低さ、見識のなさ。それも、ビジネスパーソン、おれの言葉でいえば、カモリーマンたちの科学技術の理解レベルが上がらない原因の一つ。
 もっとまともに、科学・技術・工学・数学・芸術、いわゆるSTEMやSTEAMのことを一般に伝えろよと思う。

http://iiyu.asablo.jp/blog/2008/10/12/3815127
野口悠紀雄のトンデモIT論その5
を書いたのは、もう10年前だ。
 いまだ、野口悠紀雄的なものがはびこっているわけだから、日本はアメリカはおろか、中国に追い抜かれ、後ろ姿も見えなくなりつつあるのも、さもありなん。
 コメントに、小次郎さんが的確なことを書いている。
--- ここから ---
野口さんってのは、その時代の売れ線(Google や金融工学)にすりよって、「これは素敵です、これに従いましょう」と旗を振って、それで自分は原稿料を稼ごうというものでしょう。
--- ここまで ---
--- ここまで ---

 診断結果は、夏目漱石に一番似ている。\(^O^)/
 文章の読みやすさがCの適切だけど、文章の硬さは、Eで、文章が硬いだって。
 文章の表現力はAで、とても表現力豊か。文章の個性もAで、とても個性的。\(^O^)/

文体診断結果
一致指数ベスト3
名前 一致指数 リンク
1 夏目漱石 68.3
2 遠藤周作 67.2
3 北原白秋 67.1
一致指数ワースト3
名前 一致指数 リンク
1 三木清 32.8
2 宮沢賢治 36.6
3 有島武郎 37.3
文章評価
評価項目 評価とコメント
1 文章の読みやすさ C 適切
2 文章の硬さ E 文章が硬い
3 文章の表現力 A とても表現力豊か
4 文章の個性 A とても個性的

 次は、これ。
http://iiyu.asablo.jp/blog/2018/03/23/8810087
吉川邦夫さんが訳した「More Effective C# 6.0/7.0」が出ていました。でも、「Effective C# 6.0/7.0」が出てない。(^^; 同じく吉川さんが訳した「低レベルプログラミング」のこともちょびっとだけ。
から、
--- ここから ---
 本書の内容は、「API設計、非同期プログラミング、動的プログラミング、並列処理をクールに使い倒す50の方法」の通り。
 ところが、不思議なことがあって、本書のカバーには、Moreがついてない
「Effective C# 6.0/7.0 ジェネリクスとLINQを中心に、洗練されたプログラムにする50の方法」
という本が、他のEffectiveシリーズとともに並んでいるし、本書では、Moreがついてない「Effective C# 6.0/7.0」の項目を、参照している個所がある。
 ところが、アマゾンや翔泳社を、いくら探してもない。
 それで、吉川さんに何か知らないかと、お訊ねしたら、Moreのついてない「Effective C# 6.0/7.0」の翻訳担当は、鈴木幸敏という人で、丁寧な仕事をする方なので、時間がかかっているのではないか、とのこと。
 両方並べて紹介しようと、出版をずっと待っていたのだけれど、まだ出そうにないので、吉川さんの訳した「More Effective C# 6.0/7.0」だけ、こうやって紹介している。
 Moreなしより、Moreありが先に出ているという状況。
 後述の原書の目次を調べると、Moreなしは、基本的な内容で、Moreありは、より高度な内容と思う--- ここまで ---

 今度は、吉川英治に一番似ている。\(^O^)/
 文章の読みやすさがCの適切だけど、文章の硬さは、Dで、文章が硬い。さっきより1ランクいい。
 文章の表現力はAで、とても表現力豊か。文章の個性もAで、とても個性的。\(^O^)/
文体診断結果
一致指数ベスト3
名前 一致指数 リンク
1 吉川英治 75.8
2 遠藤周作 72.5
3 野間清治 72.4
一致指数ワースト3
名前 一致指数 リンク
1 三木清 40.1
2 宮沢賢治 44.5
3 岡倉天心 45.1
文章評価
評価項目 評価とコメント
1 文章の読みやすさ C 適切
2 文章の硬さ D 文章が硬い
3 文章の表現力 A とても表現力豊か
4 文章の個性 A とても個性的

 真面目に書いたものは、どうなんだ。
http://iiyu.asablo.jp/blog/2018/03/27/8812641
18トリソミー、パトー(パトウ)症候群の子どもたちの写真集、13トリソミー(エドワーズ症候群)「運命の子 トリソミー: 短命という定めの男の子を授かった家族の物語」、21トリソミーのダウン症のことなど。保育士・教師のためのティーチャーズ・トレーニング: 発達障害のある子への効果的な対応を学ぶ。こうすればうまくいく発達障害のペアレント・トレーニング実践マニュアル
から、
--- ここから ---
 これを読むと、うちは、21トリソミーのダウン症ですが、産まれたころを思い出します。
 重い心臓疾患があって、慶應病院での大手術とか、いろいろ書きたいことはあるけれど、いまは、後から妻から聞いた話のみ、書いた気がしていたが、検索しても出てこないので、ちょっと。
 妻は、障碍児を産んだことがショックで、将来を悲観して、子供と一緒に死のうとしていたのです。しかし、ちょうど、ぼくが会社を変わるときで、有休消化でほとんど会社に行っておらず、
「あなたが、ずっと家にいたので、死のうと思っても死ねなかった」
そうです。
 ぼーっとしていて、普段は、役に立たないおれですが、たまには、役に立つことがある。\(^O^)/
 障碍児を産んだショックから立ち直った妻のその後は、素晴らしいというより、すさまじい母の愛。子供もぼくも、いくら感謝してもしきれない。
「この子を産んでよかった。この子が産まれてきてくれて、ほんとによかった」
と妻が本心から言ったとき、障碍児の子育ての苦労を乗り越えてきた母の愛情の深さに圧倒され、感動したし、人生の意味を考えました。
 妻や子供はおいといて、ぼくだけに限っても、それまで順風満帆というより無風状態の、さして起伏のない平凡な人生だったのが、一変。いろんなことを考えたり、やるようになったし、命に対する見方、社会に対する見方、人生に対する見方が、非常に広がって、生きている実感を味わうようになりました。
 それまでが、透明な細いプラスチックの棒のような、色のない、つるっとした人生だったとすれば、障碍児を持ったあとの人生は、太い幹の木で、枝があちこちに伸び、葉が生い茂り、いろいろな色に彩られた人生になった気がします。
 筒井さん(筒井康隆)が言っていた、「子に持って知る子の恩」。
--- ここまで ---

 今度は、なんと太宰治に一番似ている。\(^O^)/
 文章の読みやすさは、Aのとても読みやすいになった。\(^O^)/
 文章の硬さは、Cで、文章がやや柔かいだって。さっきより、また、1ランクいい。\(^O^)/
 文章の表現力はAで、とても表現力豊か。文章の個性もAで、とても個性的。\(^O^)/
 やっぱり、真面目に書いた方がいいんだな。なかなか書かないけど。\(^O^)/

文体診断結果
一致指数ベスト3
名前 一致指数 リンク
1 太宰治 81.1
2 新美南吉 80.9
3 海野十三 77.5
一致指数ワースト3
名前 一致指数 リンク
1 岡倉天心 41
2 伊藤正己 53.4
3 橋本龍太郎 55.5
文章評価
評価項目 評価とコメント
1 文章の読みやすさ A とても読みやすい
2 文章の硬さ C 文章がやや柔かい
3 文章の表現力 A とても表現力豊か
4 文章の個性 A とても個性的

関連:
http://iiyu.asablo.jp/blog/2016/10/12/8222823
モナドの領域。筒井康隆+佐々木敦「なぜ「最後の長編」なのか?」

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
一富士、二鷹、三は? ひらがなで。

コメント:

トラックバック