もじのすけ の文字ブログ

もじのすけ の文字ブログ

文字について考えたことをつづっています

手書き文字と活字の違い(21) ~ 活字の情報量を増やしてどうするの? ~

f:id:mojinosuke:20170629132609j:plain

 

 

【目次】

 

 

f:id:mojinosuke:20170420192746p:plain

 

もじのすけです。

 

手書き文字と活字の違い(13)から

延々と続いているのは、

「活字の情報量を増加する」

というテーマでした。

 

今回はそのゴールに当たる記事です。

 

 

 

1 前回までの軽いのおさらい+α

 

AI作成の文と

人間作成の文の区別がつかないと

一体どんなことになるのか。

 

怖い話をしたのは、

以下の記事です。

 

http://mojinosuke.hatenablog.com/entry/2017/06/15/170000#4-2ちょっと怖い話

http://mojinosuke.hatenablog.com/entry/2017/06/22/160000#3AIが文章を書く世界

 

怖い話を、短くまとめてみると

こんな感じです。

 

皆さんが

朝から晩まで起きているうちに

目にする文章。

ツイッターやネットニュース。

そして、

それらを話題とする各種コメント。

 

その文章のほとんどが

AI作成のものになり、

人間作成の文章が圧倒的に少なくなる。

 

しかも、皆さんは、

自分が目にしている文章が

AIと人間のどちらが書いた

文章なのかわからない。 

 

例えば、

このブログの文章も

人間「もじのすけ」のふりをして

AIが書いているかもしれません。

 

長文はともかく、

短い文章であれば、

AIが作成しても

人間が書いたかのような

自然な文章が作成できてしまう。

 

悪い人が

一定の方向性を持った意見を

手を変え、品を変えて活字にして

自然に大量に流通させれば、

ある種の洗脳・誘導が可能になります。

 

たとえば、

DeNAまとめ問題でクローズアップされた

他記事の盗用や不正確な記事の数々。

これらがもっと巧妙化して

自然なステルスマーケティング

なりえます。

 

他にも

特定の個人や団体が

自分たちへの批判を受けたとき、

AIによって

自分たちを賛美する文章を

大量に作成させ、

批判を埋没させて目立たなくする。 

 

 

あるいは、

これがより根本的な問題なのですが、

セットする人に

それほどの悪気がなくても、

プログラムをセットした後に、

AIが思いもよらない方向性の意見の

文章を大量に作成して流通してしまう。

 

マイクロソフトのAIの例

www.sankei.com

 

 

 

 

このような状態が生じえます。

 

 

 

 

こんな事が起こらないようにするには

どうしたらよいのか。

 

 

前回の記事では

対処法を示しました。

mojinosuke.hatenablog.com

 

前回の記事のおさらいを書いておきます。

 

増加すべき活字の情報のうち

今後最も重要になるのが

「電子媒体上の活字

 AI作成か人間作成かを

 区別できるようにすること

 

そして、

AI作成か人間作成かを

区別できるように

活字の情報の増加をさせていくこと

が対処法になります。

 

具体的には

電子媒体上の活字の

1文字1文字に

①打刻日時と

②打刻者の

情報を載せるべき

です。

 

①1文字の打刻日時については

西暦〇〇〇〇年〇〇月〇〇日

〇〇時〇〇分〇〇秒

の14桁で示せます。

これはあと約8000年は

大丈夫でしょう。

 

②1文字の打刻者については、

99兆9999億9999万9999人分の番号の

14桁で示せます。

これで数世代(数百年)は

対応可能でしょう。

 

もし、②1文字の打刻者について

機械かどうかを区別する

という目的だけに特化すると

桁数はかなり削減できます。

この場合は 

人間1、機械0の

2つの数字だけで済みます。

つまり 

②は1桁だけで対応できます。

 

①打刻日時と

②打刻者の情報を付加する。

これは、一見地味ですが、

現在の活字のインフラを変える

とても大きな話 です。

 

なぜ、こんな1文字当たり

最大28桁も情報を増加させて

活字のインフラを変えないと

いけないのか。 

 

インフラを整えるだけでは、

効果を実感しにくいでしょうから、

どんな使い方やメリットが

考えられるのか。

 

ここからは、

情報の受け手の立場のメリットと

情報の送り手の立場のメリットに

分けて考えていきましょう。

 

f:id:mojinosuke:20170706134856j:plain

駒競行幸絵巻

Imperial Visit to the Great Horse Race at the Kaya-no-in Mansion" (Kaya-no-in komakurabe gyōkō emaki), from the Tale of Flowering Fortunes (Eiga monogatari)

Period:Kamakura period (1185–1333)
Date:13th–14th century
Culture:Japan

"Imperial Visit to the Great Horse Race at the Kaya-no-in Mansion" (Kaya-no-in komakurabe gyōkō emaki), from the Tale of Flowering Fortunes (Eiga monogatari) | Japan | Kamakura period (1185–1333) | The Met

 

 

 

 

 

 

2 情報の受け手のメリット

 

情報の受け手のメリットとしては、

以下のような事が挙げられると思います。

 

例えば文字の上に

カーソルを置いたときに、

①打刻日時と②打刻者の情報が

表示される場合を

想像してみてください。

 

 

 

 2-1 文章の主体と作成日時が特定できる

 

みなさんがスマホタブレット

パソコンで見ている活字の文章。

 

その文章は、

文字にカーソルを当てるだけで

「誰が、いつ書いたのか?」が

わかるようになります。

 

いちいち、

文章の最初か最後に

記事更新の日付や名前がなくても

わかるようになります。

 

つまり 

匿名の短い文章であっても、

誰がいつ書いた文章かが

わかります。

いちいち活字の文章の内容から

書いた人の属性を

想像する必要はありません。

 

 

(書き手が匿名を維持したい場合の

 やり方は後に述べます。)

 

 

 2-2 特にAIの文章を見分けられる

 

なんと言っても一番のメリットは、

文字にカーソルを当てて

作成者のところに

「AIの番号」か

「0」か

空白が出れば、

AI作成の文章だとわかること

でしょう。 

 

 

 2-3 文章の作成経緯を特定できる

 

「いやいやいや。

 人間やAIが

 他人が打刻した文字をコピペして

 文章を作ったらどうするの? 」

「区別つかないでしょう?」

 

と思った方がいるかもしれませんね。

 

大丈夫です。

 

そのようなコピペの場合でも

文章の作成経緯が分析できます。

それによって

文章の作成者を特定できます。

 

 

ポイントは①打刻日時の情報です。

 

 

f:id:mojinosuke:20170628225537j:plain

 

文章の作成者は誰か。

それでは場合を分けて見てみましょう。 

具体的にはこんな感じです。

 

(1)人間Aが他人Bの文を全部コピペ

まず、人間Aが人間Bの文章を

丸ごとコピペした場合です。

こういう場合を

「デッドコピー」というようです。

 

この場合はどうなるでしょうか。

 

全ての文字の打刻者は

他人Bになります。

 

全ての文字を

1人が打刻しているのですから、

文章は打刻者Bが作成したと

言ってよいでしょう。

 

(2)人間Aが他人Bの文を一部コピペ

この場合はどうなるでしょうか。

 

この場合は、

1つの文章の中に

打刻者Aの部分と打刻者Bの部分が

並立することになります。

 

ここでは

Aの打刻日時(後)と

他人Bの打刻日時(先)を

見比べるだけで、

Aが他人Bの文章をコピペした事実と

コピペした範囲がわかります。

 

「あ、Aさんは、ほとんど

 Bさんの文章をパクっているな。」

とわかるわけです。

 

(3)AIが人間Bの文を全部コピペ

この場合は、

パクったのが人間でなくAIだ

というだけに過ぎません。

 

全ての文字の打刻者が人間Bになるので、

文章はBの作成と言ってよいでしょう。

 

(1)の場合と同じです。

 

 

(4)AIが人間Bの文の一部をコピペ

この場合はどうでしょうか。

 

1つの文章の中に

打刻者AIの部分と打刻者Bの部分が

並立することになります。

 

ここでは

AIの打刻日時(後)と

人間Bの打刻日時(先)を

見比べるだけで、

AIが人間Bの文章をコピペした事実と

コピペした範囲がわかります。

 

「あ、AIさんは、ほとんど

 Bさんの文章をパクっているな。」

とわかるわけです。

 

(ちなみにこの文章は

 (2)の解説のほぼコピペです。)

 

 

(5)AIが大勢の人間の文字をコピペ

この場合は、

1つの文章の中に

大勢の打刻者が生じることになります。

 

例えば1文字~数文字単位で

打刻者や打刻日時が違う場合には

複雑なコピペの文章だとわかります。

 

人間の場合は、

1文字~数文字単位でコピペを

繰り返すことは不自然です。

 

また、人間は

「できます。」と活字で書くときは、

で→き→ま→す→。

の順で打刻します。

文字の出現性・文字の時間性

 

たとえば

で・・・2017年7月6日15時12分15秒

き・・・2017年7月6日15時12分15秒

ま・・・2017年7月6日15時12分16秒 

す・・・2017年7月6日15時12分16秒

。・・・2017年7月6日15時12分17秒

となります。

人間ならこのような

打刻日時の流れが自然でしょう。

 

これに対し、

1文字~数文字単位で打刻者が違ったり

上のような打刻日時が

バラバラになっている場合は

どうでしょうか。

 

たとえば

で・・・2015年5月16日1時5分15秒

き・・・2017年1月1日1時1分1秒

ま・・・2016年3月24日15時47分16秒 

す・・・2015年7月6日13時55分22秒

。・・・2010年11月14日20時27分54秒

という場合です。

 

このような場合は、

人間がコピペしたのではなく、

AIが文字を細かくコピペした

ということがわかります。

 

 

(6)人間BがAIの文を丸ごとコピペ

この場合、

AIが全ての文字の打刻者なので、

文章の作成者はAIでしょう。

 

(7)人間BがAIの文の一部をコピペ

この場合はどうでしょうか。

 

1つの文章の中に

打刻者AIの部分と打刻者Bの部分が

並立することになります。

 

ここでは

AIの打刻日時(先)と

人間Bの打刻日時(後)を

見比べるだけで、

人間BがAIの文章をコピペした事実と

コピペした範囲がわかります。

 

「あ、Bさんは、ほとんど

 AIさんの文章をパクっているな。」

とわかるわけです。

 

(ちなみにこの文章は

 (2)の解説のほぼコピペです。)

 

(8)小さなまとめ

このように、

①打刻日時と②打刻者の情報があれば、

文章の作成日時や作成者が

書かれていなくても、

文章の作成の経緯や

文章の作成者が特定できるのです。

 

 

f:id:mojinosuke:20170707194104j:plain

Letter writer

Factory:Meissen Manufactory (German, 1710–present)
Modeler:Johann Joachim Kändler (German, Fischbach 1706–1775 Meissen)
Date:ca. 1740
Culture:German, Meissen

Meissen Manufactory | Letter writer | German, Meissen | The Met

 

 

 2-4 活字の文章の解析ができる

 

「文字にカーソルを当てるなんて

 めんどくさいし、見にくい。」

「あんまり意味ないのでは?」

というご批判もありそうです。

(考えすぎでしょうか?)

 

そこで、情報の受け手の

もう少しメリットをお話しします。

 

文字にカーソルを当てて

①打刻日時と②打刻者の情報を

表示させる。

このようなやり方に

絞る必要はありません。

 

見た目に表示されなくても

データとして記録されていれば、

文書や文章や文字の

機械による解析が

できるようになります。

 

1文字単位で機械で解析すると、

AIがどこまで関わった文章なのかが

細かくわかります。

 

例えば、

ある文章は、

「AI作成  〇文字・・・の部分。

 人間A作成 〇文字・・・の部分。

  ・・・

 人間D作成 〇文字・・・の部分。」

という形で解析できます。

 

その文字成分の分布を解析すれば、

誰の文字が

・文書のどの部分に

・どれだけの量で

配置されているかによって、

「文書の作成名義人が誰か。

 AIか人間か。」を

自動的に特定できる事になります。

 

それ以上に

文字の成分分布を解析できると

何がよいのか。

 

電子書籍やネット記事など、

文字の著作物についての

かなりの部分について

書き手の権利関係が

整理できるように思います。 

 

このあたりは次回にしましょう。

 

3 まとめ 

 

今回は情報の受け手のメリットについて

お話ししているうちに

かなり堅く、

かなり長くなってしまいました。

 

手書き文字と活字の違い(13) ~活字が表す情報②~ - もじのすけ の文字ブログ

から延々と続いている

「活字の情報量増加」の話。

この話は

もうすでにゴール(結論)に

入っています。

 

ですが、

ゴールネットに行き着かず、

ちょっと気持ち悪い状態です。

もう少しだけお付き合い下さい。 

 

 

次回は、

①打刻日時、②打刻者の情報による区別 

によって生じる書き手のメリットや

考えられるサービスをご紹介し、

ゴールネットまで

行き着きたいと思います。

 

 

ひょっとすると

気が変わって

お遊び記事が入るかもしれません。

 

おつかれさまでした。

 

 

f:id:mojinosuke:20170412200459j:plain

 

 

 

f:id:mojinosuke:20170604004054j:plain

 

冨嶽三十六景 上総の海路 (葛飾北斎

At Sea off Kazusa (Kazusa no kairo), from the series Thirty-six Views of Mount Fuji (Fugaku sanjūrokkei)

Artist:Katsushika Hokusai (Japanese, Tokyo (Edo) 1760–1849 Tokyo (Edo))
Period:Edo period (1615–1868)
Date:ca. 1830–32

Katsushika Hokusai | At Sea off Kazusa (Kazusa no kairo), from the series Thirty-six Views of Mount Fuji (Fugaku sanjūrokkei) | Japan | Edo period (1615–1868) | The Met

 

  page top ↑

 

 

 

 上杉謙信の手書き文字から作った

 「けんしんフォント」無償公開中

  【ダウンロードはこちら】

        ↓
 http://mojinosuke.hatenablog.com/entry/2017/04/06/130000

 

  

定期的に読んでいただけると嬉しいです。 

↓↓↓