駒澤塾:中学受験の算数・理科

中学受験の算数・理科を中心に書いて行きます。駒澤が旧字体なのは検索をしやすくするためです。

はてなブログではEnterで段落になる

はてなブログの記事を書く時に、EnterキーとSHIFT+Enterキーを使い分けると検索エンジンでのヒット率が上がるかも知れません。 

その二つの違いは「段落」と「改行」です。 

検索エンジンから見て、その二つは大きな違いが有るはず。 

これの使い方を間違えると読んで欲しい人に記事を見つけてもらえなくなるかも? 

 

以前、じわじわと広がっているように感じられる「スマホ書式」の記事を書きました。

その記事で書いた「スマホ書式」とは、 

★十数文字で意識的に改行を入れて、
★その改行も1行ではなく、2行も3行も間を空けて・・・ 
 時には10行もの改行を「無駄に」はさむ、という書き方です。 

komazawajuku.hatenablog.com

記事からも感じると思いますが、私はこの書式が好きでないです。
理由は情報が「こま切れ」になってしまうから。 

無駄な改行により、「文章」が壊れて「単なる単語の集合体」になってしまいます。
私にとっては凄く読みづらい文章の書き方です。 

読みづらいとは言っても、頭の中で上の行と下の行を合体させて読むことは出来ます。 

 

あれ? と思いました。 

人間は行をまたいだ文章も頭の中でつなげて読めるけれど、
コンピュータは、どうなのだろうか? 

 

以前、こんな記事を書きました。 

2020-06-18 前世紀の知識データベース回顧

(データベースの用語だらけで、すごく長い記事です)

komazawajuku.hatenablog.comその末尾にこんなことを書きました。 

 

もう一つは、ひとつの対象に複数のキーワードが付く場合に、キーワード同士の「距離」という情報が検索の精度を上げる重要な役割を持ち得るということ。 

 

科学技術文献速報というデータベースでは、検索を「キーワードが有るか無いか」だけでなく、「キーワード同士が隣り合っていたり、近くに有るかどうか」などの条件を付けて抽出することが出来たという話です。 
現在、chatGPTなどのAI検索ではキーワード同士の関係性を含めて質問文の形で指示できますが、科学技術文献速報の検索システムでは、数十年前にそれに近いことを実現していたわけです。 

もっとも、それを実現するために大変な手間をかけていました。
1:論文を大学の先生や大学院生の手で百数十語程度の抄録にする。
2:抄録の内容が正確な要約になっているか、別の人が精査する。
3:抄録を語句ごとに番地の数字を付けてデータベースに登録する。
これを収録する「全ての」論文に対して行って近接指定を可能にしていました。

 

最近の検索エンジンは、対象とする文献をプログラムが構文解析までおこないます。
これは言ってみれば、科学技術文献速報の時代には人間がやっていたキーワードの距離関係まで含めたデータベース化を、準備されたアルゴリズムに従ってプログラムが自動的に実施しているということです。 

 

さて、この視点から「スマホ書式」を見ると? 
スマホ書式」では、文章どころか単語までバラバラになってしまっています。 

すると、何が起きるでしょうか。 

人間なら「常識に従って」おこなえる元の文章の復元も、プログラムには限界があるはず。

よって、

検索エンジンに収集されるキーワードの質が落ちます。 

★利用者が情報を探すときにヒットする確率が落ちます。 

検索エンジンの画面に表示される順位も大きく落ちます。 

ということになるのでは無いでしょうか。 

 

いわゆる「スマホ書式」で文章を書く人は、人間が(と言うか、その人本人が)読みやすい書式とするつもりで、コンピュータから見るとひどく読みづらい文章を書いている可能性があるわけです。

 

しかも、その人たちが使っているのは「改行」ではなく「段落」です。
そのことは、ブラウザからページのソースを見るとわかります。

「改行」は <br>です。
「段落」は <p> </p>です。

 

インターネット経由のブラウジングで、画面はHTMLという書式で作られます。 
はてなブログでも「編集 そのまま」の隣に「HTML編集」が有りますよね。 
私も、たまにHTMLを直接いじくって、ちょっと凝った書式を表示させています。 

 

単純にEnterキーを押した時が「段楽』
SHIFT+Enterキーを押すと「改行」になります。

ちなみにiPadで画面上のソフトキーボードを使う時も同じで、左端の「上向き矢印マーク」を押しながらEnterです。

この二つは、画面上で見るだけなら行の間隔の違いにしか見えません。

 

たとえばEnterだけだと

このくらいの間隔になります。

 

それをSHIFT+Enterにすると
こんな感じで行の間がつまります。

 

人間から見たら改行幅のちょっとした違いです。
しかしコンピュータから見たら「改行」と「段落」では大きな差となる可能性があります。
それに加えて「スマホ書式」で書いている人は、文章そのものすらブチブチと切ってるわけ。

 

蛇足?

スマホ書式」は、せっかくの情報発信の手間がもったいないなと感じてしまいます。
ですが、もしかしたら「スマホ書式」を書く人は違う感覚を持っているのかも知れない。
「文書としての構造」で意思を伝えるのはかったるくて、「単なる単語の羅列」を投げつけて意味が伝われば良いじゃんと思っているのかも知れない。
そんなことを「映画を早送りで見る人たち」という本を読んで考えました。
長くなりますので、その話は別稿にて。

 

 

このブログはリンクフリーです
リンク(はてな用語で「言及」)に事前連絡は不要です
出典を示して頂けるならコピーペーストも自由にどうぞ。
って言うかリンクやツイートでgoogleの表示順が上がるので大歓迎