日本語以外の多くの言語では、単語と単語の間に空白(スペース)を入れます。
日本語では漢字やカタカナ、句読点など複雑な文字を使用すれば自然と単語の境界が分かるため、あまり使用されません。
しかし詩や歌の世界や、子供向けの絵本などではよく現れます。
漢字やカタカナが角が多くて とげとげしい印象を与えることが敬遠される場合や、漢字を習う前の子供にも わかりやすく するためです。
ですが これは とても もったいない ことです。
ひらがなが 文の構成上 連続する場合には スペースが存在すると その境界が わかりやすく なります。
漢字が多数 連続 使用されたり、コンピュータ ソフトウェアの ように カタカナ ワードが続く際にも当てはまります。
もちろん これは今後の日本が外国人移民のために門戸を開く際にも 難しい漢字ルールを学ばせる必要性を軽減することにも つながります。
ひらがなだけで構成された文章は、日本語をよく知っている日本人は もちろん、日本語をあまり知らない外国人でも比較的 早く読むことができるようになります。
限られた時間と費用で文書を作成しなければならないなら、日本語で書いた漢字交じりの文章を、読み仮名を振るとか、いちいち翻訳家を通して他言語に訳すとか、外国人の日本語漢字教育のためにコストをかけるよりも はるかに合理的な選択ではないでしょうか。
特に道路標識や地図、交通系の案内や、ホテルその他の観光掲示板、パンフレットの類です。
他にもカナが救いになるのは学習進度の浅い子供に対してもですし、もしかすると発達障害や視力障害を持つ人や、自分が高齢になって認知症など様々な多重の問題を抱えた場合にも助けになる可能性があります。
コンピュータと分かち書き
コンピュータにとって、日本語のように空白の区切りがない言語は処理がしづらい言語です。
通常、会話などでは言葉の間に微妙に間を挟んだり、アクセントの登場回数によって単語の切れ目を認識するヒントが得られますが、テキストの場合については 発音情報の多くが 捨てられてしまうため 複雑な問題となります。
一般に、コンピュータで 単語の分割位置を推定する方法 (トークナイジング) としては、形態素解析ライブラリを用いる方法がなどあり、これは ちょうどカナ漢字変換システムにおいて もっぱらよく用いられます。
しかし、実際 漢字変換すると 区切りを機械に認識させるために、位置を調整したり、いくつかの文字を消してみたり 色々と手間が発生します。
これが うまく行かない理由としては、たとえば「ながら見」「見える化」「推しメン」のような新語の類や、方言、スラング、略語などで、教科書的な日本語の文法から 逸脱したような使われ方がなされるケースがしばしばあることです。そういった単語情報は 辞書に追加していく必要があり、また現在扱っている文のテーマから 離れているものを推定して 優先度を下げるなどというような、複雑なメンテナンスを日々要する点が挙げられます。
もし最初から 分かち書きを 行なっていれば、単語の切れ目を 誤って 変換してしまうことが なくなります。
仮に 分かち書きを しないルールに なっている場所に 原稿を 提出する必要が あるにしても、機械的に 余分な スペースを消すのは 難しくないので、最終段階で まとめて削除すれば良いです。逆に スペースを 入れていく 作業は 人の手で 対応しないと なかなか うまく いきません。
逆に 漢字変換済みのテキストを 解読する際には、同じ漢字に対して いくつもの読み方があることが 問題となります。“通っている” のような表記では「とおっている」と読むと予想されますが、「かよっている」、あるいは「ツウって居る」と “通” が 名詞であるケースもあるので 正確に一発で発音や品詞を特定することができない場面があります。
そのほかにも検索系のシステムでも有効です。
たとえば、埼玉県には「さいたま市」という市があります。ここで複数の市について書かれた資料の中から、「さいたま」という文字を含むものを探そうとしたとします。すると「…に行こうとしたさいたまたま見かけた…」というような文中の単語をまたぐ形で余計なものを見つけてしまったりします。
西多摩(にしたま)なら「…にしたままで」や いずれにせよ ひらがなだけで検索しようとすると おかしな場所にヒットしてしまうことがあります。
ひらがなで検索するなんて めったに ないだろうと思うかもしれませんが、音声入力などを考慮すると、データが漢字では読みが特定できないので カナのデータが必要になったりします。また食べ物で “イチゴ” “いちご” “苺” など表記が安定しない言葉もあるので、カナでの入力を 強制することもあります。
では入力も検索対象も 漢字なら 分かち書きなしでも問題ないかと言うと、そうとも言えません。
たとえば住所を含んだデータベースの中で、 “京都府” を検索すると、“東京都府中市” が抽出されることがあります。他にも “大津市” と “津市” 、“大阪市” と “東大阪市” のように、別の場所の地名を含むようなものは どれも誤って抽出する可能性があります。
もし最初から単語ごとにスペースで区切ってあれば、スペース付きで検索することで余計なものを除外して検索が可能です。しかし実際は そのようになってはいないので、例外としてひとつずつ整理しなければなりません。
このように日本語の文書において単語の境界は明確ではないため、機械がそれを適切に認識していないままデータが保存されていると、検索時に取りこぼしや 逆に 無関係なものを取りすぎて しまうのです。
OCR
分かち書きはテキストをカメラなどで自動認識 (OCR)する際にも有意です。
名刺や資料など紙の文書をデータ化する必要があるケースです。
たとえば 「1こ」のような語句は「に」1字と認識される可能性がありますが、スペースが前後にあるならこれは独立した単語であるとの判別が可能です。「に」一字なら単語としての意味はないのでその可能性は排除できます。
似たようなパターンでは「しま」=「ほ」 、「イ山」=「仙」のようなものです。原稿用紙のように1文字の幅が固定であればこのような連結はあり得ませんが、手書きや文字ごとに幅が異なるプロポーショナルフォントだと 境界があいまいに なります。
しかし分かち書きによって単語として区切りが明確であれば、そのような単語があるかどうかを辞書データから調べることで正確さを高めることができるでしょう。
このようなルールはPCの操作を学習していない子供が筆記試験など紙にペンで記述してもらったものをデータとして読み込み解析する場合などシステム化に役立つ可能性があります。
長文ではありませんが、現在機能している似た技術として、「姓」と「名」の分割があります。
行政などに提出する手書きの書類では、姓と名の欄が2つに分かれていることがほとんどですが、その欄が 姓のみ だと あらかじめ わかっていれば、よくある姓のデータベースとマッチさせることで、自動認識の精度を高めることができ、全部を入力せずに済ますことができます。
住所欄の都道府県と市町村の枠が分かれているものもありますが、これも都道府県は47通りの中から選択するだけで良いので精度がかなり高くなります。もし欄が一個だと、区切りが どこかわからず、都道府県を省略していきなり市町村から書かれていたりするケースも想定すると自動認識の精度は落ちることになります。
上に書いたように分かち書きによって漢字を使わなくても わかりやすい記述が可能になるなら、難しい漢字の使用をさせないと言う選択肢もあります。そうするとコンピュータによる処理の精度はもっと高いものになるでしょう。
ひらがな ばかりだと 頭が悪そうに見えると言う言説もありますが、機械に読ませるためにマークシートに色塗りするよりかは遥かに高等ですし、郵便番号のように数字の羅列を使うよりずっと人間的です。
カナだけで分かち書きする表記が知的で無いとするなら、カナよりはるかに文字種の少ないアルファベットだけで常に表記している外国人はどうなるのでしょう。
助詞と分かち書き
日本語には〇〇を
や〇〇は
、〇〇へ
のように、単語境界で前の単語との関係性を与える助詞
という役割を持つ文字があります。
特にを
・ヲ
は助詞での使用に限定されています。
現在「を」は何か動作に使用する<目的格>を作るために使われ、必ずそこが単語の切れ目になることを示す記号として強い効果を持っています。
「おとこ」を旧仮名づかいの「をとこ」と書いて、「あのわかいをとこ」などと書くと、先入観で つい無意識に「あのわかいを」「とこ」と分割しそうになりますが、「あの わかい をとこ」と別な箇所に空白を入れると単語の境界がそこには無いことを伝えることができます。
「を」を文中に入れて何になるのだと思うかもしれませんが、これは特に外来語の運用の問題につながっています。
ローマ字入力や五十音表の位置から、を
ヲ
の発音は「wo」であると認識されることがあります。
実際には「オ」と同じ音なのですが、これをwoとすると貴重な文字資源の活用余地が生まれます。
外来語に「wo」の発音を持つものについては基本「オ」と書くか、もしくは「ウォ」としなければなりません。
例えば 四分の一を表す quarterは クォーター と書くことが多いですが、よく w 音が欠落して発音されます。 クウォーターは発音的には近いものの字数が増して冗長です。クヲーターと書くことができるなら表現の幅も広がり発音の区別も正確になります。
他にも韓国の원 (ウォン)を ヲンと書いたりもできますし、濁点付きの ヺ
(ヲ゛)なども含めると相当数の新たな発音を既存のコンピュータシステムのままで生み出せる余地があると言うことです。
ゑ
ヰ
ゐ
ヱ
という文字も現在のシステムではほぼ問題なく扱えますから、これも含めて利用すればもっと多くの発音を今の文字体系でそのまま実現可能です。
を
ほどでは無いですが、は
も読みやすくなります。
例えば “避難はしご” のように 漢字の後ろには
が続く複合語は、助詞のは
と見間違えて「わ」と発音してしまったり、一瞬混乱させてしまう表記ですが、は
の後ろにスペースがないものは助詞では無いという認識が立てば、そのような勘違いを防ぐことができます。
ルビ点・傍点
分かち書きが いくつかの局面で有用であることは確かですが、いくつか どうしても 使用できない局面というのも あるでしょう。これは古くは 金属製の活字を用いた活版印刷の世界や、これを前提として文章を組み上げる 原稿用紙のような書類もそうでしょう。
そういう場所でも ひらがなや カタカナが 連続する場合や、熟語で常用漢字外の文字が続く“障がい”(障碍) や “夜とぎ”(夜伽)など 助詞と紛らわしい場合など、区切りを明確にしたい時というのがあります。
この場合に用いられるのが傍点またはルビ点と呼ばれるもので、例えば「障がいがある」のようにして点を打つことで分かち書きの代用とすることができます。
これがよく使われる特殊な例としては、外国映画の日本語字幕があります。限られた秒数で視聴者に読ませる必要があり、画面の幅にも制約があることから 文字数は抑える必要があります。作品に影響を与えるので過剰な装飾は避けなければなりません。
この手法は 日本語の固定幅の文字組みを 残しながら、ルビという裏技を使った 付け足しの手法です。近代の慣例を崩さず 手っ取り早い 手法ではありますが、初見では 他言語に見られるアクセント記号や 下線で強調するのと 意図を誤解する可能性があります。
他のデジタル技術が発達し、スペースの他に 斜体字 や 太字 などの装飾表現のほか、文字の大小を変えたり文字幅を詰めるカーニング調整も かなり簡単にできるようになっていますから、やり方を限定する必要性も薄れてきていると言えます。
加えて 日本語だけでなく 英語や 他の言語が 混じった 文章を記述するのには、全角で “ABC” などとすると 間延びして 不格好ですし、読み方(発音の認識)にも影響があります。人間の目の視点の中心から 一度に認識可能な幅というのは限りがありますから、「Computer System」よりも「Computer System」のほうが 単語を知っている場合は早く認識できますし、スピーディーな発音をイメージさせる作用があるということです。
よって この傍点という存在を 単語境界の役目として使うのは あくまで過渡期の技術であって、今後の著作で 積極的に利用すべき技術とは 考えにくいものがあります。
入力上の課題
現在大抵パソコンのキーボードでは使用するOSや設定にもよりますが、スペースを打つと変換がかかってしまったり別な挙動をすることでしょう。
しかし一度入力した後に 戻ってスペースを差し込み直すのは なかなか面倒な作業です。
カナで入力中の文字の下に点線が引かれている、変換前のタイミングで Control+Space、Option+Spaceなどで全角スペースを差し込めることがあるので まずはこれを試してみてください。
ShiftキーやCapsLockで一時的に半角英数モードになる設定があるものなら これを有効にすると さらに半角スペースも差し込める場合があります。
MS-IMEや Macのことえりではこれらが使用できます。左手でShiftなど修飾キーを押さえながら、右手親指でスペースを打つか、またはその逆が使えます。
キー操作としては あまり使いやすいとは 言えませんが これについては入力ソフト側の改良が望まれます。
または少し設定が複雑ですが、スペースキーでの変換を無効にし、かわりに変換はキーボードの↓
キーや、あれば[変換]
キーを使ったり、句読点や自動変換を活用する方法もあります。
Mozc や Google日本語入力など、ローマ字入力のキーマップを変更しやすい IME を自分でインストールして、@
や;
など日本語であまり必要としないキーをスペースに割り当てる方法もあります。
スマートフォンの場合、日本語に続く文字の時に自動でスペースが全角になる機能が働いているものがあります(iOS 13以降では「スマート全角スペース」)。これを設定でオフにするなど対策可能です。
どこで分割するべきか
入力する方法が 分かったとして、果たして現代の日本語では いったいどこで 分割するのが適切なのかという問題に ぶつかることがあります。
基本的には文節レベルで 分割することになりますが、切ると意味が違って見えるケースです。
むかしむかし あるところに おじいさんと おばあさんが すんで いました。
ここで「むかしむかし」を「むかし むかし」と分けた方が良いか、「あるところに」は「ある ところに」で分けるかといった具合です。
そもそも 今の日本語では 分かち書きを 積極的に使うような ルールはありません。その昔 1950年頃 日本で漢字変換できるコンピュータが無く カナ専用のカナモジタイプライター が使われていた頃、分かち書きに関しては積極的に議論が行われていましたが、漢字を使って文字種を切り替える場合には また状況が異なります。
分かち書きが使われている例を 参考に見てみます。
英文
英文では基本的に全ての単語がスペースで分割されます。これは日本語の漢字のように 単語境界が明らかになるマークがないので、代わりにスペースが使われていると考えると簡単です。
しかしフルネーム(氏名)を fullname とするか full name とするかのように、英文でも分割すべきかどうか疑わしい語句もあります。
その他 固有名詞や新語の際は、-(ハイフン)を使って例えば e-mail や e-commerce など 複数の単語を つなげて使う場合もあります。
分かち書きを標準とする言語であっても このように 多少の揺らぎが あります。
ローマ字
ローマ字文では 原則として全ての単語で分割する という ルールがあります。
文化庁サイトに昭和24年11月10日に開かれた 第1期国語審議会の資料 が ありますが、この中で分かち書き部会が設定した方針があります。
以下、文例は省きますが引用です。
- 単語は原則として一続きに書き,他の単語から離して書く。
- a 接頭語は続けて書く。
b 接頭語のように用いられることばも続けて書く。 - a 接尾語は原則として続けて書く。
b 接尾語のように用いられることばも続けて書く。
c 固有名詞に続く接尾語は離して書く。
d 固有名詞に続く「さん」「くん」「様」「氏」「殿」などの敬称は離して大文字で書き始める
e 接尾語のうち,「だらけ」「ぐらい」は離して書く。 - a 助動詞は原則として続けて書く。
b 助動詞のうちで「だ」「です」「らしい」「ようだ」,および伝え聞く意味を表わす「そうだ」は離して書く。
c 助動詞「う」は接続する動詞・助動詞などによって,それぞれの行のオ段長音となる。 - a 助詞は離して書くのを原則とする。
b 助詞「は」「も」が,助詞「に」「で」に重なった場合には続けて書く。
c 接続の「と」は続けて書く。
d 禁止の「な」は続けて書く。
e 用言につく助詞のうちで,「ば」「ても(でも)」「て(で)」「ながら」「たり(だり)」などは続けて書く。
f 「に」を伴って副詞句となる場合は続けて書く。 - 複合語には続けて書くもの,つなぎ[-]入れて書くもの,および離して書くものがある。
a 1語としてじゅうぶんに熟したもの,および連濁の現象を生じているものは,原則として続けて書く。
b 複合語を構成する成分語の独立性がそれぞれ強いもの,および成分語の一つ,あるいは全部が独立性が弱く,単独では独立語として普通に用いられにくいものには,つなぎ[-]を入れる。
c 成分語がそれぞれ独立性が強く,しかも複合語として誤解されるおそれのないものは離して書く。 - 複合固有名詞は次のように書く。
a 国・都・府・県・市・町・村などを伴った固有名詞は原則としてつなぎ[-]を入れて書く。
ただし「町」・「村」を伴わないでは地名として用いられないようなものは続けて書く。
b 固有名詞と普通名詞とが複合してできた一つの固有名詞(役所・銀行・会社・団体・場所・施設・建物などの名前)は,それが他に同類がなく,ただ一つのものである場合には,普通名詞も語頭を大文字で書くのを原則とする。
ただし,分けがたいもの,および連濁現象の現れたものは続けて書く。
c 同類があるものは,普通名詞を小文字で書く。 - 複合固有名詞を構成する成分語が,いずれも固有名詞である場合にはつなぎ[-]を入れて書く。
i. 日本人の姓名。
ii. 同一の地名などを区別する場合。
iii. 二つの地域を合併して一つの呼び名で呼ぶ場合。
iv. 会社名などを冠した駅名など。 - 「上」「下」「東」「北」「新」などの接頭語のついたて固有名詞は,接頭語の部分も大文字で書き始めつなぎ[-]を入れて書く。
- 「前」「裏」「わき」などの接尾語を伴う固有名詞は,接尾語の部分を小文字で書き,その前につなぎ[-]を入れる。
例を省略しているので 分かりにくいですが、ここに規定されているのは日本語独自の助詞や、複合語、接頭語・接尾語の扱いなどです。
接頭語・接尾語の「続けて書く」とは
「おじいさん」は“ozîsan” とし、“o zî san” とはしないということです。
一方で「助詞は離して書くのを原則」ですから、
「おじいさんと」は“ozîsan to” となります。
この振る舞いはちょうど英文で to, in, or, at のような前置詞や接続語に見られるのと似ています。
しかし このルールをカナに適用し、「おじいさん と」まで適用すると、かなり冗長な感じがします。
また複合語では「独立性が強い」という言葉が現れますが、これは “国会議員” などの語句が、“国会” と “議員” に分けて使用できるというようなことを言っています。
「むかしむかし」のような語は単独で使えるので「むかし むかし」とすることができる一方で、 “昔々” のように漢字では まとめてしまうことも でき「じゅうぶんに成熟している」とも言えそうです。
とはいえローマ字でmukasimukasiを続けて書くと読みやすいとは言い難いので、通常であれば分ける方が自然でしょう。
「用言につく助詞」は「すんで」を「すん で」とは しないことに なります。これは特別に不自然さはありません。
以上の例からすると、ローマ字での 分かち書きルール は、漢字を使用するケースに当てはめるには 少し スペースの数が多すぎるような印象があります。 漢字を使うと大抵は 字数が減りますから、2字 3字の間隔でスペースが頻発することになります。
この国語審議会のメンバーでもある堀内庸村氏は、この時期にカナの分かち書きの議論について出版もしていた時期でもあります。当時と今とでは使われる技術やカタカナ語やアルファベットなどの普及状況が異なるので再整理される必要はあるものの、分かち書きをするメリットについては何十年も前から指摘されることでもあります。
その他の用例
近年 (おそらく2010年以降) 、テレビ番組や映画などで スペースが活用されているケースが いくつかあります。個別の番組や作品などにより やり方が一様でないですが、おおむね次のような例があります。
- 文末
- 話者の発言の休止時間
- 極端に長いカタカナ語
- 極端に長い漢字複合語
文末というのは “○○首相○○国訪問 ○○サミット開催” などのようなニュース見出しにある例で、ふつうの文章で言えば 、
か 。
の 句読点が置かれるような場所です。記号を減らして 雑多な情報を単純化しているものと見られます。
発言の休止時間というのは、インタビューであったり 出演者が なにか 長い話をしているときに、その話者が発言に詰まったりしているような場合に、その “間” を視覚化するものです。より間が長いケースだと “・・・” とか “…” の3点リーダーが使われることもありますが、文末か文頭に限られるようです。
長いカタカナ語 は、「コーポレート ガヴァナンス」「アファーマティヴ アクション」「ソーシャル ディスタンス」のような耳慣れない外来語の連続を見やすくするためのもので、これは 分かち書きの 目的に合致した 使い方です。このパターンは ・
の中黒点を挟むこともあります。
漢字複合語のケースでの用例は あまり多くなく、“○○県 ○○協会 ○○支部” などのように、組織名など単語としての独立性が高い状況で出現します。これは独立したラベルとして現れやすく、文として溶け込むような使い方はあまりされていません。
以上の例では 一応は 見やすくする工夫はしているけれども 積極的に使っているようではありませんが、これに対し、 一部の ソフトウェア企業には 違う傾向があります。
たとえば Google ドキュメントや スプレッドシートなどでは “フォント サイズ” とか “アクティビティ ダッシュボード” など 辞書に載ってないであろう カタカナ語の連続に対しては 明確にスペースが開けられていて、ヘルプなど他の部分にも 同じ表記が用いられています。
同じことは Microsoft にも言えて、“スペル チェック”、“タスク マネージャー” などのほか、msn.com においては “トップ ストーリー”、“カジュアル ゲーム” などの表記を見つけることができます。
意図は明らかではありませんが、目的の情報が視覚的に認識しやすいほか、検索の際に単語を正確に覚えていなくても関連する情報が探しやすいなど利点が考えられます。グローバル企業で 全世界的にソフトを翻訳する都合から 単語レベルでの取り扱いが楽なようにしていることも考えられます。
しかし、同じように世界企業でも Apple、Amazon などでは このような傾向はなく、あくまで英単語の前後にのみ スペースが適用されていると見られます。
スペース幅
一般にPCで入力されるスペースは、日本語だと半角「 」と全角「 」の2つのスペースが主流です。
古い時代、日本語のワープロで英字とカナの混ぜ書きをするのに、英字が ちょうど 日本語の文字の半分になるように 組まれていた名残です。
このことは昔、Shift-JIS や EUC-jp のような文字コードで、日本語の文字を素早く画面に表示するのにも意味がありました。これらの文字コードでは日本語は2バイト文字とも呼ばれ、画面のどの場所に表示するのかを決めるのにデータサイズから容易に判断がつくという特徴がありました。
現在では文字の種類が格段に増えて、さらに文字をバランスよく配置するのに、プロポーショナル フォントという文字ごとに異なる幅を持つフォント(字体)も多く使用されています。
現在の体系では、実はスペースの幅というのは2つではありません。次のようなものがあります。
呼称 | HTML | Unicode |
---|---|---|
スペース、半角スペース |   | U+0020 |
全角スペース |   | U+3000 |
nスペース(文字nと同幅) |   | U+2002 |
mスペース(文字mと同幅) |   | U+2003 |
1/3幅スペース |   | U+2004 |
1/4幅スペース |   | U+2005 |
1/6幅スペース |   | U+2006 |
細(1/8)スペース |     | U+2009 |
毛細(1/24)スペース |   | U+200A |
ゼロ幅スペース | Èb; | U+200B |
表にHTMLでの記法を入れていますが、テキストエディターでHTMLを直接編集するような人であれば 少し手間を割けばこれらの文字を 使えます。
またAdobeの InDesignのような 雑誌や書籍の専門のソフトでは、これら特殊文字を直接入力する機能があります。
これらの文字は例えば 英字カナ混じり文で、英単語と日本語の間に挟むのにもちょうど良い幅を提供してくれます。よくある例としては
当サイトは Google Chrome と Internet Explorer にて動作確認されています。
の ようなものです。
英単語にスペースが 入っている関係上、その前後にスペースがないと バランスが悪いのですが、等幅で半角スペース1個を入れると大きすぎるため今度は日本語のバランスが おかしくなります。そんなとき、1/8 ならば あまり目立ちません。
ゼロ幅スペースというのは、見かけ上は分かりませんが、コンピュータにだけ認識可能なスペースです。これによって 画面の幅が異なる端末同士で 改行の位置を特定の位置に強制したりできます。ダブルクリックや長押しした際に選択される場所を調整する効果もあります。
遠い地名や住所だったり、単語境界のわかりにくい「五里霧中」「キリマンジャロ」のような語句がありますが、これに類するような語句を見かけを崩すことなくデータベースなどに登録するには使えるかもしれません。
このように、簡単に入力もできず、見た目にも存在が認識しづらいながらも、複数の大きさの スペースが実現されています。
もともと考えてみれば、はるか むかしに我々の祖先は、筆を使って文字を書いていて、一字一字の大きさや 前後に どれくらいのスペースを開けていたかは その時の感情や様々な都合で自由に書いていました。
一文字一文字を同じ大きさで書くようになったのは 仏教の経典を写経したり、原稿用紙の上で 人々が作文を練習しているうちに 遺物の呪いに かかってしまった ようなものです。
いま 日本語の 分かち書きを 見て どことなく 違和感を感じることが あるとすると、頭の中で 縦横の格子のようなものが見えていて、入力するスペース幅でさえも、半角か全角の2つに 縛られているということも ひとつ原因として考えられます。
日本語の表示先が 新聞のように紙を主としていた時代では、前述のような 半端な幅は うまく使えなかったかもしれませんが、今後 電子端末が主流となれば、入力体系としてこのような幅の違うスペースが簡単に入力できるように なると これまでにない 新しい やり方が 見えてくるかも しれません。
中途半端にスペースを開けると、あまり 美しくは見えないのですが、これは句読点(、
。
)や括弧「
」
の 使い方や、カタカナ語の連続などにも 言えることです。文字の見た目の広さが 日本人の発音のリズム認識を崩すからです。
しかし 日本語が外国語との相互運用を深める中で カナにしてもスペースの扱いにしても調整は不可避であり、句読点には それを行頭に 置いてはいけないという禁則処理があるように、この分かち書きの問題に関しても 恐らくは何らかの最適解が あるはずです。
それはまだ 誰にも見えていないものですが、いづれ発明が なされることでしょう。