一般の文章の文字の出現確率の情報から、モールス符号の長さの決め方を検証してみました。欧文と違って、出現頻度に関係なしに符号が決められていることがよくわかると思います。HI
末尾に、頻度順の符号長のグラフを入れました。(2002/06/16)
| 和文頻度 | 文字 | 出現確率(%) | 符号 | 符号長単位数(1短点+デリミタ1短点長スペースを足した長さを1とする。それに各文字の文字間デリミタ1を足す) | 和文平均との比較 (6.391より長い/短い) |
和文重み付き符号長 |
| 1 | ゛ | 9.502 | トト | 3 | 短い | 0.285 |
| 2 | い | 5.054 | トツー | 4 | 短い | 0.202 |
| 3 | か | 5.027 | トツートト | 6 | 短い | 0.302 |
| 4 | し | 4.721 | ツーツートツート | 9 | 長い | 0.425 |
| 5 | た | 4.236 | ツート | 4 | 短い | 0.169 |
| 6 | て | 4.161 | トツートツーツー | 9 | 長い | 0.374 |
| 7 | の | 3.88 | トトツーツー | 7 | 長い | 0.272 |
| 8 | と | 3.858 | トトツートト | 7 | 長い | 0.27 |
| 9 | う | 3.843 | トトツー | 5 | 短い | 0.192 |
| 10 | ん | 3.368 | トツートツート | 8 | 長い | 0.269 |
| 11 | つ | 3.132 | トツーツート | 6 | 短い | 0.188 |
| 12 | わ | 2.554 | ツートツー | 5 | 短い | 0.128 |
| 13 | に | 2.545 | ツートツート | 7 | 長い | 0.178 |
| 14 | こ | 2.498 | ツーツーツーツー | 9 | 長い | 0.225 |
| 15 | な | 2.395 | トツート | 5 | 短い | 0.12 |
| 16 | く | 2.286 | トトトツー | 6 | 短い | 0.137 |
| 17 | る | 2.043 | ツートツーツート | 9 | 長い | 0.184 |
| 18 | き | 2.027 | ツートツートト | 8 | 長い | 0.162 |
| 19 | ま | 2.023 | ツートトツー | 7 | 長い | 0.142 |
| 20 | よ | 1.852 | ツーツー | 5 | 短い | 0.093 |
| 21 | も | 1.806 | ツートトツート | 8 | 長い | 0.144 |
| 22 | あ | 1.781 | ツーツートツーツー | 10 | 長い | 0.178 |
| 23 | ら | 1.608 | トトト | 4 | 短い | 0.064 |
| 24 | す | 1.515 | ツーツーツートツー | 10 | 長い | 0.152 |
| 25 | さ | 1.449 | ツートツートツー | 9 | 長い | 0.13 |
| 26 | お | 1.414 | トツートトト | 7 | 長い | 0.099 |
| 27 | れ | 1.395 | ツーツーツー | 7 | 長い | 0.098 |
| 28 | を | 1.394 | トツーツーツー | 8 | 長い | 0.112 |
| 29 | り | 1.384 | ツーツート | 6 | 短い | 0.083 |
| 30 | そ | 1.177 | ツーツーツート | 8 | 長い | 0.094 |
| 31 | は | 1.117 | ツートトト | 6 | 短い | 0.067 |
| 32 | ち | 1.101 | トトツート | 6 | 短い | 0.066 |
| 33 | け | 1.008 | ツートツーツー | 8 | 長い | 0.081 |
| 34 | せ | 0.943 | トツーツーツート | 9 | 長い | 0.085 |
| 35 | え | 0.932 | ツートツーツーツー | 10 | 長い | 0.093 |
| 36 | み | 0.926 | トトツートツー | 8 | 長い | 0.074 |
| 37 | ゆ | 0.911 | ツートトツーツー | 9 | 長い | 0.082 |
| 38 | ひ | 0.886 | ツーツートトツー | 9 | 長い | 0.08 |
| 39 | や | 0.835 | トツーツー | 6 | 短い | 0.05 |
| 40 | ふ | 0.718 | ツーツートト | 7 | 長い | 0.05 |
| 41 | ほ | 0.686 | ツートト | 5 | 短い | 0.034 |
| 42 | ろ | 0.614 | トツートツー | 7 | 長い | 0.043 |
| 43 | め | 0.582 | ツートトトツー | 8 | 長い | 0.047 |
| 44 | ね | 0.319 | ツーツートツー | 8 | 長い | 0.026 |
| 45 | む | 0.3 | ツー | 3 | 短い | 0.009 |
| 46 | ゜ | 0.289 | トトツーツート | 8 | 長い | 0.023 |
| 47 | へ | 0.267 | ト | 2 | 短い | 0.005 |
| 48 | ぬ | 0.11 | トトトト | 5 | 短い | 0.006 |
| 6.391 | ||||||
| 和文重み付き平均符号長 |
和文の出現頻度順に符号の長さを並べてみました。出現頻度が少ない文字にも短めの符号が割り当てられていることがわかります。欧文のそれと見比べると、違いがよくわかります。横軸は頻度順、縦軸は、頻度は%、文字長は短点マークを1とする単位長。一番短い「ヘ」が2単位となります。47番目!
