もじのすけ の文字ブログ

もじのすけ の文字ブログ

文字について考えたことをつづっています

手書き文字と活字の違い(22) ~ 活字の情報量を増やしてどうするの?② ~

 

f:id:mojinosuke:20170706202907j:plain

Jaharis Byzantine Lectionary

Date:ca. 1100
Geography:Made in Constantinople
Culture:Byzantine

Jaharis Byzantine Lectionary | Byzantine | The Met

 

 

【目次】

 

 

f:id:mojinosuke:20170420192746p:plain

 

もじのすけです。

 

手書き文字と活字の違い(13)から

延々と続いているのは、

「活字の情報量を増加する」

というテーマでした。

 

堅い長文が続いてすみません。

 

今回は

ボールがそのゴールラインを超えた後に

ゴールネットまで

ころころと転がるような記事です。

 

もうすでにゴールなのですが、

せっかくなので、

丁寧なゴールになれば

と思います。

 

最初にお断りします。

重たい長文になってしまいました。

 

わかりにくいところは

全部を理解しようとせず、

共感できそうな所だけつまみ食い!

という感覚で見てください。

 

 

1 前回までの軽いのおさらい+α

 

以前の記事 

mojinosuke.hatenablog.com

で書いたのは以下のお話です。

 

増加すべき活字の情報のうち

今後最も重要になるのが

「電子媒体上の活字

 AI作成か人間作成かを

 区別できるようにすること

 

そして、

AI作成か人間作成かを

区別できるように

活字の情報を増加させていくこと

が対処法になる。

 

こんな話でした。

 

 その続きの記事が、こちらになります。

mojinosuke.hatenablog.com

 

この記事では、

活字の情報量の増加による

AI作成の文章と人間作成の文章を

どう区別するか、について

具体的に書きました。

 

具体的には

電子媒体上の活字の

1文字1文字に

①打刻日時と

②打刻者の

情報を載せるべき

です。

 

①1文字の打刻日時については

西暦〇〇〇〇年〇〇月〇〇日

〇〇時〇〇分〇〇秒

の14桁で示せます。

 

これであと約8000年は

大丈夫でしょう。

 

②1文字の打刻者については、

99兆9999億9999万9999人分の番号の

14桁で示せます。

 

これで数世代(数百年)は

対応可能でしょう。

 

もし、②1文字の打刻者について

機械かどうかを区別する

という目的だけに特化するなら

桁数はかなり削減できます。

 

この場合は 

人間1,機械0の

2つの数字だけですみます。

つまり 

②は1桁だけで対応できます。

 

①打刻日時と

②打刻者の情報を付加する。

これは、一見地味ですが、

現在の活字のインフラを変える

とても大きな話 です。

 

なぜ、こんな1文字当たり

最大28桁の情報を増加させて

活字のインフラを変えないと

いけないのか。 

 

インフラを整えるだけでは、

効果を実感しにくいので、

どんな使い方やメリットが

考えられるのか検討してみましょう。

 

そんなことをお話ししました。

 

そして前回の記事です。

mojinosuke.hatenablog.com

 

この記事では、

活字に

①打刻日時②打刻者の情報を

付加することによる

(1)情報の受け手のメリット

をお話ししました。

 

メリットはAIと人間の区別に限らず、

考えられる限りで挙げています。

以下のとおりです。

ちなみに

カッコ書きは前回の記事では

書かなかった自己ツッコミです。

 

それでは、

情報の受け手のメリットの

おさらいです。

 

・①打刻日時と②打刻者の特定ができる

 

「それを付加するのだから

 これは当たり前の結論でしょう。」

 

 

・AI作成の文章か人間作成の文章か

 の区別ができる

 

「もともとそれが目的なので

 これも当たり前の結論でしょう。」

 

 

・文章の作成経緯が特定できる

 

「誰が他人の文章を使ったか

 すぐにわかる。これはいい。」

 

 

・文章の解析ができる

 

「活字の文書の文字成分の解析を

 機械にやらせると

 いろいろ応用できそう。」

 

 

 

情報の受け手は

以上のようなメリットが受けられます。

これが前回までの話でした。 

 

今回は、

残りのメリットについて

考えていきましょう。

視点は

(2)情報の送り手のメリット

(3)活字の情報量増加のインフラを

   利用した新しいサービス

です。

 

 

    美味しいところがあるかも?

f:id:mojinosuke:20170707184330j:plain

My Service To You

Artist:Thomas Rowlandson (British, London 1757–1827 London)
Artist: After George Moutard Woodward (British, ca. 1760–1809 London)
Publisher:Rudolph Ackermann (London)
Date:October 20, 1799

Thomas Rowlandson | My Service To You | The Met

 

 

 

2 (2)情報の送り手のメリット 

それでは、

情報の送り手のメリットについて

考えてみましょう。

 

 

情報の送り手としては、

活字に

①打刻日時と②打刻者の情報が

付加されていたら、

どんなメリットがあるのでしょうか。

 

文字にカーソルを当てたら、

打刻日時と打刻者が表示される

という状況を想定してみてください。

 

 2-1 引用がラク

まず考えられるのは、

引用がラクになる

ということです。

 

 

(ⅰ)引用元を書かなくてよい

いちいち引用元を書かなくてもよい、

というメリットが考えられます。

 

書く方としては、これはラクですよ。

 

コピペしても、

引用元をいちいち書かなくて済む。

 

1文字単位で

①引用元の文字の打刻時間と

②引用元の文字の打刻者の

情報が載っているので、

誰が元ネタの発信者なのかは、

すぐにわかる

ということです。

 

 

(ⅱ)ブロックチェーンよりも簡単

もし、このやり方でなく

ブロックチェーンを利用したら

どんな形になるでしょうか。

 

そもそも

ブロックチェーン

とはなんでしょうか。

 

今回は詳しく説明するつもりは

ありませんが、

簡単に言えば、

「帳簿」を

みんなで共有して

衆人環視の中で公明正大に

書き込んで管理する

というイメージのものです。

 

帳簿の書き込みを

みんなが確認できるようにして

積み上げていく感じです。

 

 

この

ブロックチェーンを使って

引用元、元ネタが誰のものかを

確認する方法は、どうでしょうか。

 

引用元、元ネタを確認するために

ブロックチェーンを使うのであれば

引用するたびに、

誰がどのように引用したかの情報を

どんどん上乗せしなくてはなりません。

当然のことながら、

情報量がどんどん増えていきます。

 

しかし、今回のやり方だと

最初に打刻するときに

①打刻日時②打刻者の情報を

1文字1文字に載せるだけです。

情報の上乗せは必要ありません。 

 

1文字半角1バイトや

1文字全角2バイトが

①打刻日時14桁の14バイト

②打刻者14桁の14バイト

を足して、

28バイトの増加で済みます。

 

ブロックチェーンを使って、

わざわざ情報を

上乗せする必要が無いのです。

 

その意味で

①打刻日時②打刻者の情報を

活字に載せることは

ブロックチェーンより

簡単です。 

 

(ただし、

 ある文書の全コピーをした人や

 コピペだけした人の情報も

 活字に載せたい!

 というのであれば、

 ブロックチェーンを使って

 それらの情報を上乗せすることも

 アリだと思います。)

  

要するに、

書き手としては、

引用元を表示せずにすみます。

 

引用元がわかるようにするための

情報量を

あまり増やさずにす

ということです。

 

f:id:mojinosuke:20170707185517j:plain

『諸國六玉川』歌川広重
Six Tamagawa Rivers from Various Provinces (Shokoku Mu Tamagawa)

Artist:Utagawa Hiroshige (Japanese, Tokyo (Edo) 1797–1858 Tokyo (Edo))
Period:Edo period (1615–1868)
Date:1857
Culture:Japan

Utagawa Hiroshige | Six Tamagawa Rivers from Various Provinces (Shokoku Mu Tamagawa) | Japan | Edo period (1615–1868) | The Met

 

 

(ⅲ)引用の関係が機械的に表示

引用の関係を機械的に表示できる、とは

どういうことでしょうか。

 

これは

情報の受け手の話でもあります。

 

ある2つの文章について

引用の関係を調べるのであれば、

文章の文字成分を

解析し比較するだけで、

かなりのことがわかります。

 

例えばこんな感じです。

 

f:id:mojinosuke:20170713120217j:plainf:id:mojinosuke:20170713120319j:plain

 

(赤字は打刻者が違うところです) 

 

これを比較するのです。

 

それでは

先ほどの文章例1、2の比較によって

一体何がわかるのでしょうか。

 

おそらく、 

(Ⅰ)文章同士が独立しているか否か

(Ⅱ)一方が他方を引用しているか否か

(Ⅲ)引用しているならその先後

(Ⅳ)引用しているならその範囲

がわかります。

 

(Ⅳ)引用の範囲がわかる

= どこまでが引用で、

  どこからが引用者のコメントか、

  がわかる。

 

そうすると

昨今話題のフェイクニュース

誰かの文章の引用型の場合は

ある程度対応できると思います。

 

どこの文字入力作業のときに

フェイクが入ったかが

わかるからです。

 

フェイクニュース関係の話は

別の機会があればお話ししましょう。

 

 

注意が必要なのは、

この比較なら何でもわかる!

とは限らないことです。

 

たしかに

紛らわしい場合はあります。

 

例えば、

「引用する人が引用元の文章を

 コピペするのではなく、

 書き写して打刻する場合」

です。

 

この方法だと、

引用した人は、

他人の文章を打ち直しただけなのに

まるで自分が最初に書いた人のように

見えてしまう かもしれません。

 

その場合に備えて、比較するときは、

文章同士の

文字の一致度も

比較要素に入れるべき

だと思います。

 

文章同士の文字の一致度を比べつつ、

一致した文字の打刻日時を比べれば

どちらが先に書かれたものかは

一目瞭然でしょう。

 

今でも、

文章同士の一致度は、

論文引用検索サービスなどの

一定の分野で

すでにサービス化されている

と思います。

 

しかし、

論文の本文の「外の情報」として

誰がいつ書いたかを記録した上で、

比べているにすぎません。

 

それよりは、

論文本文の「中で」、

文字(活字)の打刻日時で

端的に見比べた方が

精度も汎用性も高いと思います。

 

 

 

 

文章例1、2の文字成分の比較は、

引用の引用などの「再引用」や、

引用の引用の引用の・・・などの

「数次的引用」にも対応できます。

 

 

このことは、みなさんが

Word文書やブログなどを書く場合を

考えるとわかりやすいと思います。

 

結局のところ、

みなさんが文章を書くときに、

文章の1フレーズを参照して

コピペしたら、

ほかに何もしなくても

自動的に引用元を示したことになる

ということです。

 

これは楽チンですよ。

大きなメリットの1つです。

 

 

(ⅳ)研究者の論文のメリット

(ⅲ)の話と同じですが、

①打刻日時②打刻者の情報は、

特に引用関係を

明示しなくてはならない

研究者の方にとって

メリットが大きいです。

 

研究者の方が

論文を作成する場合にも、いちいち

引用を示さないで済むのであれば、

さぞかし論文作成が

はかどることでしょう。

 

さらに

文字成分解析ソフト・アプリを

プログラムとしてセットすることが

考えられます。

 

文字成分解析ソフトに

論文の文章を入れれば、

すぐに他の論文との間で

どちらがどちらを引用したかが

表示されることでしょう。

 

今回の話だと

文字(活字)の①打刻日時が

記録されているので、

2つの論文に限らずに関係が示せます。

 

つまり

多数の論文の引用関係図

(家系図みたいなもの)が

自動的に作成できる

と思います。

 

その意味で 

現時点で存在する

論文引用参照ソフトよりも

はるかに精度が高いものが作れる

と思います。

 

論文作成者や査読者としては

かなりラクだと思うのですが。

どうでしょうか?

 

 

(ⅴ)文献学的にもメリット

これも(ⅲ)の話と同じですが、

文献学の視点でも意味があります。

 

文献学では、

手書き文字の特徴その他の事情から

古書の成立時期・作成者を特定し、

引用関係を研究すると思います。

 

どちらが先か、誰が作ったか。

専門家でも、これらを特定するのに

四苦八苦しますよね。

 

現代は、手書き文字より

活字の文章が圧倒的に流通しています。

活字には匿名性があり、

手書き文字よりもさらに

打刻者を特定しにくいです。

 

現代の活字の文章を後世の人が見たら、

その文章がネット上だけで存在し、

そもそも本が無い場合もあるでしょう。

 

後世の人達は、きっと今の我々と同じか

それ以上に四苦八苦するでしょう。

 

その対策として、

①打刻日時と②打刻者の情報を

活字に載せておけばよいと思います。

 

そうすれば、

私たちが古書を見比べるより高い精度で

後世の人が

電子文書や電子文章の活字の引用関係を

機械的・自動的に比較できると思います。

 

つまり、

情報の送り手としては、

活字で素晴らしいことを書いたら

ネットに出しただけで、

後世の人から、言い出しっぺとして

探し出してもらえる、

ということです。

 

 

f:id:mojinosuke:20170707184636j:plain

清 任薰 高士臨風 扇面
Scholar in the Wind

Artist:Ren Xun (Chinese, 1835–1893)
Period:Qing dynasty (1644–1911)
Date:ca. 1880
Culture:China

Ren Xun | Scholar in the Wind | China | Qing dynasty (1644–1911) | The Met

 

 

(ⅵ)引用を示さないのは無礼?

以上が

「引用がラク」

というメリットのお話でした。

 

もしかすると

引用を表示しなくてよい

とすることに

不快感を覚える方も

いらっしゃるかもしれません。

 

もちろん

先駆者への敬意を表するため、

礼儀上は引用を明示することが望ましい

と思っています。

 

その意味で

引用元を記載した方がよい

というのは確かです。

 

ですが、今回の話なら、

引用を示すほどの

たいそうな文でない場合に

いちいち引用元を

表示しないですむという点で

「真面目な人ほど気がラクになる」

と思います。

 

また

今回の活字の情報量の増加は、

引用元を示さないような書き手の文章

であっても、引用元が判明する、

というとても大きなメリットが

あるように思います。

 

 

以上

「引用がラク」

というお話でした。

 

 

f:id:mojinosuke:20170707192108j:plain

明嘉靖 剔彩壽字紋漆盤
Dish with the character for longevity (shou)

Period:Ming dynasty (1368–1644), Jiajing period (1522–66)
Date:1522–1566
Culture:China

Dish with the character for longevity (shou) | China | Ming dynasty (1368–1644), Jiajing period (1522–66) | The Met

 

 

 

 

 

 2-2 文字の著作物の権利範囲を明確化 

ああっ。終わらない!

 

話が長くなってしまいました。

ここで記事を終えるかどうか迷いました。

 

うーん。

内容の切れ目としては

続けたい気持ちが強いですが、

続けると明らかに長いし、読みにくい。

 

そこで

ちょっとだけ

次のメリットの紹介をして、

今回は終わりましょう。

 

 

次に考えられるメリットとしては、

文字の著作物の

著作権(創作性)の範囲を

ある程度客観化したり

明確化できる

というものです。

 

この後、

(2)情報の送り手のメリットの続きとして

著作権」の話をします。

 

その次は

(3)活字の情報量増加のインフラを

   利用した新しいサービス

の話です。

 

 

 

今は

ボールがゴール(結論)に入り

ゴールネットに近づいた状態です。

 

 

今回も

長文にお付き合いいただき、

ありがとうございました。

 

 

f:id:mojinosuke:20170412200459j:plain

 

 

f:id:mojinosuke:20170707201743j:plain

[The Ascent of Mont Blanc]

Artist:Auguste-Rosalie Bisson (French, 1826–1900)
Photography Studio:Bisson Frères (French, active 1852–1863)
Date:1861
Medium:Albumen silver print from glass negative
Classification:Photographs

Auguste-Rosalie Bisson | [The Ascent of Mont Blanc] | The Met

 

 

  page top ↑

 

 

 

 上杉謙信の手書き文字から作った

 「けんしんフォント」無償公開中

  【ダウンロードはこちら】

        ↓
 http://mojinosuke.hatenablog.com/entry/2017/04/06/130000

 

  

定期的に読んでいただけると嬉しいです。 

↓↓↓