もじのすけ の文字ブログ

もじのすけ の文字ブログ

文字について考えたことをつづっています

手書き文字と活字の違い(20) ~活字の情報量を増加する 1文字1文字に日時と文字打刻者をのせるべき~

f:id:mojinosuke:20170628193915j:plain

【目次】

(冒頭の作品)

Textile fragment with pattern of human figures

Period:Edo (1615–1868)
Date:18th–19th century
Culture:Japan
Medium:Silk

メトロポリタン美術館

 

 

f:id:mojinosuke:20170420192746p:plain

 

もじのすけです。

 

手書き文字と活字の違い(13)から続く

「活字の情報量増加」の話は

いよいよ佳境に入ってきました。

 

1 前回までのおさらい

 

まずは前回までのおさらいをしましょう。

 

ところどころ

正確な引用ではなく超訳してます。

気になるところがあったら

適当に寄り道して下さいね。

 

・活字には

 毛筆・硬筆の手書き文字ほどの

 情報量がない

 http://mojinosuke.hatenablog.com/entry/2016/11/02/193000#5活字で対抗できないか

 

 活字の情報量を

 増やす方法を考えてみよう

  http://mojinosuke.hatenablog.com/entry/2016/11/02/193000#6活字の表現伝達機能の増量

  

・そもそも活字にはどんな情報が

 載っているのだろうか

 

・活字には弱いながら感情情報がある。

 http://mojinosuke.hatenablog.com/entry/2017/04/30/180000#2-1活字の感情情報

 他には?

 

・公共性のある活字を使っているので

 ①話題の公共性を示す書き手の意図

 がある。

 手書き文字と活字の違い(13) ~活字が表す情報②~ - もじのすけ の文字ブログ

  

・例えば「富士山」の活字が書かれた

 紙があったら、踏みにくい。

 だから活字にあるのは、

 ②文字(活字)に表れた情報の存在感

 他には?

 手書き文字と活字の違い(13) ~活字が表す情報②~ - もじのすけ の文字ブログ

  

・活字の場合、匿名性があるが、

 わずかながら

 ③書き手の存在感が「ある」

 手書き文字と活字の違い(14) ~活字が表す情報③~ - もじのすけ の文字ブログ

  

・その書き手の存在感を

 深めて考えてみると

 文字は無かったところから

 ある瞬間に「出現」する

 (文字の出現性)

 http://mojinosuke.hatenablog.com/entry/2017/05/18/160000#4文字の出現性客体性時間性

  

・手書き文字は1画1画の、

 活字は1字1字の、

 時間の流れの中で出現する 

 (文字の時間性)

 http://mojinosuke.hatenablog.com/entry/2017/05/18/160000#4文字の出現性客体性時間性

  

・文字は誰かが出現させている

 (文字の客体性)

 http://mojinosuke.hatenablog.com/entry/2017/05/18/160000#4文字の出現性客体性時間性

 その出現させる主体は誰か? 

 

 

そして、このあたりから

AI(人工知能)が

話題に上がってきました。

 

手書き文字の主体は「人」

 手書き文字と活字の違い(16) ~文字の客体性 主体は誰か?~ - もじのすけ の文字ブログ

 

それでは、活字の主体は?

 たいていは「人」だけど

 今後はコンピュータも

 手書き文字と活字の違い(17) ~文字の客体性 活字の主体は誰か?~ - もじのすけ の文字ブログ

 

・大多数の文字や音楽は、

 本やCDという媒体から離れ

 短縮化している。

 手書き文字と活字の違い(18) ~文字が媒体から離れるという話~ - もじのすけ の文字ブログ

 

・短文化し、

 流通が拡大する活字の文章。

 疲れ知らずのAIが

 文章を作成したら

 世間にあふれかえる。

 

 人間作成の文は

 圧倒的少数派になってしまう。

 

 人間はどう対応すべきか?

 手書き文字と活字の違い(18) ~文字が媒体から離れるという話~ - もじのすけ の文字ブログ

 

 ・対策1

 たたかう?

   =AIの文字作成を止める?

 止められない。ムリゲー。

 科学技術の進歩は止められない。

 http://mojinosuke.hatenablog.com/entry/2017/06/22/160000#4ー1対策1戦う

 

・対策2

 あきらめる?

 あきらめるにしても、

 AI作成の文と人間作成の文が

 区別できないと気持ち悪い。

 http://mojinosuke.hatenablog.com/entry/2017/06/22/160000#4ー2対策2あきらめる

 

・対策3

 じゃあ区別する?どうやって?

  ↑

 今ココ

   

 

 

AI(人工知能)作成の文字に

どう区別して対応するのか。

 

これは人類が抱える壮大な問題です。

 

私は、多忙な仕事の合間を縫い

現実逃避のために、人類のために、

この危機的な問題に

向き合っています。

 

それでは、みなさんと一緒に

考えていきたいと思います。

 

 

 

f:id:mojinosuke:20170629001543j:plain

 

 

 

 

 

2 結論

 

 

いきなり結論を書きます。

 

 

 

 

これからは、

電子媒体上の

活字の1文字1文字に

①打刻日時

②文字打刻者

の情報を載せるべきです。

 

 

 

 

 

 

 

 

「はあ?」

という心の声が

聞こえてきそうです。

 

 

「手書き文字と活字の違い(13)から

 さんざん引っ張っておいて

 結論、地味じゃね?」

と思われた方。

多分居られると思います。

 

 

・・・すみません。

たしかに

地味な結論です。

 

ですが、

この対策が

意味するところは

地味ではありません。

 

 

AIによる大量の文章作成。

この問題の対策として、

活字に

①打刻日時、②打刻者 の情報

を載せることは

 

現在の活字の

インフラを変える

とても大きな話

 

です。

 

 

なぜ

活字のインフラを変えないと

いけないのか。 

 

これから

・そのような対策をとる理由

(→ 今回の記事)

 

・対策の具体的な内容

(→ 今回の記事)

 

・その対策を導入した場合のメリット

(→ 後の記事)

 

をご説明しますので、

どうかお付き合い下さい。

 

 

 

 

 

f:id:mojinosuke:20170628204234j:plain

 

 

 

 

3 対策の理由  

 3-1 本や記事の単位

 

みなさんがよく目にする

ネット記事や本。

 

これらの著者が

AIなのか、人間なのか。

区別するには

どうしたらいいでしょうか。

 

一番カンタンなのは、

記事や本の著者の名前を

どこかに明示することでしょう。

 

この著者名の明示を一般的には

「署名」「記名」といいます。

 

記事や本のレベルなら

署名、記名を入れれば済む。

 

人間の名前が書いてあれば

 人間が作成したもの。

 

・何も書いていないか、

 AIの名前が書いてあれば

 AIが作成したもの。

 

この区別が一番わかりやすいです。

まあ、当たり前かもしれませんね。

 

 

 3-2 短文・一文・1文字単位 

 

ところが、 

記事や本のレベルより

細かくなったらどうでしょうか。

 

コピペされた一文や

色んな文が組み合わせられた

短文はどうでしょうか。

 

問題になるのは

人間作成の言葉・文字と

AI作成の言葉・文字が

混じっているときです。

 

このとき

署名・記名での区別は

役に立ちません。

 

 

もう少し具体的に説明しましょう。

 

問題なのは、

AIが作成した文を

人間がコピペし、

そこに自分の言葉を足したり

修正したときです。

 

あるいは、

人間が作成した文を

AIがコピペし、

そこに自分の言葉を足したり、

修正したとき、です。

 

ツイッターや各種コメントのように、

短文レベル、一文レベル、

ひいては1文字レベルで、

AIの言葉と人間の言葉が

混在していたら?

 

それは誰の文章でしょうか?

 

本当に困った問題です。

 

 

記名や署名で乗り切りますか?

 

 

でも、

一文一文、1文字1文字に

作成者の名前を入れていたら 

落ち着いて読めませんよね。

ウザいですよね。

 

【一文一文の例】

読めませんよね。BYもじのすけ

ウザいですよね。BYもじのすけ

 

【1文字1文字の例】

ウBYもじのすけ

ザBYもじのすけ

いBYもじのすけ

でBYエーアイ1号

すBYエーアイ1号

よBYエーアイ1号

ねBYエーアイ1号

。BYエーアイ1号

 

 

・・・この辺で止めときます。

ほんとにウザいですよね。

 

 

じゃあどうすればよいか?

 

そこで出てくるのが、

 

活字の1文字1文字に

①打刻日時

②打刻者

の情報を載せる

という対策なのです。

 

 

 

 

f:id:mojinosuke:20170628225537j:plain

 

 

4 打刻日時・打刻者の情報の載せ方

 

1文字1文字の活字に

①打刻日時と②打刻者の情報を

どんな風に載せるか?

 

 

以下は一つの例です。

(もっといい形があれば

 ぜひ教えて下さい。)

 

まず①打刻日時の情報です。

 

これは

西暦〇〇〇〇年〇〇月〇〇日

〇〇時〇〇分〇〇秒

の14桁で示せます。

 

 

 

 

 

次に②打刻者の情報です。

 

ここで出てくるのが

個人1人1人の番号です。

つまりマイナンバーです。

 

国番号+マイナンバー。

あるいは全地球人の

通しマイナンバーです。

 

(今回は技術の問題なので

 プライバシーは?とか

 個人情報は?とか

 マイナンバーの扱いは?

 などの法律的な問題は

 今回はとりあえず

 おいておきます。)

 

そのマイナンバーの分類は

どんな形式でもよいのですが、

要は

個人を識別できる数字情報を

入れる桁数を

確保する必要があります。

 

 

 

 

現在の地球人を約70億人とし、

法人も入れて約80億人だとします。

そこから

今後生まれてくる人間・法人の数も

考慮に入れて余裕を作ります。

 

そうすると

99兆9999億9999万9999人

の分まで準備すれば

数世代(数百年間)は

大丈夫でしょう。

これも14桁で示せます。

 

 

そうすると

半角1バイト 全角2バイトの

1文字当たり、

①打刻日時として14桁の数字

(14バイト?)

②打刻者として14桁の数字

(14バイト?)

を入れることになります。

 

つまり、今までは最低

1文字当たり1or2バイト

だったのが、

1文字当たり29バイトor30バイト

となります。

 

 

素人なので

この理解で合っているか

分かりませんが、

 

これまでの

15~29ケタ分増加した

情報量活字に載せる

 

ということになります。

 

 

これは技術的には

決して不可能ではないと思います。

 

ブロックチェーン云々が

話題に上がる昨今では、

30ケタ分の情報量増加ぐらい

何とかなると思っています。

 

 

知り合いのSEの人に聞いたら

だいたいその理解でよいと

教えてもらいました。

(違っていたらすみません。)

 

 

 

ただ、

「桁数が多すぎる。

 省略できる部分は省略する。

 人間の個人識別までは不要。」

と割り切るのであれば、

桁数は減らせます。

 

これは

「人間か人間以外か」

だけを分ける方法です。

 

②打刻者情報を

人間なら「1」

AI(などの人間以外)なら「0」

とすればよいです。

これなら

1桁すなわち1バイトで済みます。

 

 

 

ここで2点注意が必要です。

 

 

 

まず1つ目の注意点。

 

情報を載せる対象の1文字は

可読記号としての1文字

(例:ひらがな、漢字)

であって、

マシン語のアルファベットなどの

1文字ではありません。

 

マシン語レベルの1文字単位にまで

①打刻日時②打刻者の情報を

載せる必要はありません。

 

 

 

 

そして2つ目の注意点。

 

①打刻日時 14桁

②打刻者  14桁 は、

目に見えるように

表示する必要はありません。

埋め込めばいいだけです。

 

つまり、先ほどの

「BYもじのすけ」

みたいな表示は不要だ

ということです。

 

こんな風に

活字1文字につき、

①打刻日時

②打刻者 

の情報を入れれば、

短文、一文、1文字であっても、

AI作成と人間作成の

区別ができることになります。

 

 

 

 

5 続きは後の記事

 

「活字の情報量を増加する」

これが一連の話のテーマです。

 

増加すべき情報のうち

今後最も重要になるのは

「電子媒体上の活字の作成者

 AIか人間かを区別する情報」

だと思います。

 

そして、

その情報の増加の方向性としては

 

電子媒体上の活字の

1文字1文字に

①打刻日時と

②打刻者の

情報を載せるべき

 

だと思います。

 

 

「1文字30バイトの情報量増加で

 区別ができることはわかった。」

 

「でも区別できるだけじゃ

 物足りないね。」

 

「情報量を増加して区別して

 それが私たちの暮らしに

 どんなメリットがあるの?」

 

「AIが作成する大量の活字に

 どんな新しいサービスで

 具体的に対応するの?」

 

と思われた方が多いことでしょう。

 

 

この点は、

続きの記事でお話ししましょう。

多分

その記事がゴールになると思います。

 

 

 

 

 

今回も長文にお付き合いいただき

ありがとうございました。

 

 

f:id:mojinosuke:20170412200459j:plain

 

 

f:id:mojinosuke:20170628235950j:plain

琉球八景 長虹秋霽(葛飾北斎
Autumn Sky at Chōkō (Chōkō shūsei), from the series Eight Views of the Ryūkyū Islands (Ryūkyū hakkei)

Artist:Katsushika Hokusai (Japanese, Tokyo (Edo) 1760–1849 Tokyo (Edo))
Period:Edo period (1615–1868)
Date:ca. 1832

メトロポリタン美術館

http://www.metmuseum.org/art/collection/search/49940?sortBy=Relevance&ft=sky&offset=0&rpp=100&pos=89

 

 

  page top ↑

 

 

 上杉謙信の手書き文字から作った

 「けんしんフォント」無償公開中

  【ダウンロードはこちら】

        ↓
 http://mojinosuke.hatenablog.com/entry/2017/04/06/130000

 

  

 

 

定期的に読んでいただけると嬉しいです。 

↓↓↓