tohokuaikiのチラシの裏

技術的ネタとか。

明治安田生命が発表している「名前ベスト100」で使われいる漢字自体のランキング

毎年発表されますね。年度の毎の「こんな名前が流行です」ってランキング。
明治安田生命 | 名前ランキング2013

漢字自体は?

どんな漢字が人気なのかなーって。思って調べてみた。

コード

文字列解析ならPHPでしょう。え、Perl?なにそれ?

<?php
$s=<<<EOF
葵	31
さくら	28
...... /* 省略 */
瑠那	5
栞奈	5
EOF;

$stat = array();
foreach (explode("\n",$s) as $l){
	$data = explode("\t", trim($l));
	for($i=0; $i< mb_strlen($data[0], 'UTF-8'); $i++){
		$kanji = mb_substr($data[0], $i, 1, 'UTF-8');
		$stat[$kanji]++;
	}
}

arsort($stat);
$stat_2 = array();
foreach ($stat as $s=>$n){
	if (!isset($stat_2[$n])){
		$stat_2[$n] = array();
	}
	$stat_2[$n][] = $s;
}

foreach ($stat_2 as $n=>$sa){
	asort($sa);
	$stat_2[$n] = $sa;
}

foreach ($stat_2 as $n=>$sa){
	foreach ($sa as $k){
		printf("%s : %d \n", $k ,$n);
	}
}

exit();

女の子の結果は、

テーブルの見やすさとか、気にしないで一気貼り。

15
13
13
10
10
10
8
8
6
6
5
5
5
4
4
3
3
3
3
3
3
3
3
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

ついでに男の子

17
15
11
10
9
7
7
7
6
6
4
4
4
3
3
3
3
3
3
3
3
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
駿1
1

なんで、男の子が「ついで」かっていうと、自分のムスメの名前をあと4日で決めない*1となんだけど、まだ何も決まってないからこんなの調べたっていう経緯で。

ついでに、占有係数も考慮した

あれね、たとえば「美」は、回数以上に付ける人も多いからもっと頻繁に女の子の名前で目につくんじゃないかってことで。

女の子

359
327
251
240
196
186
169
145
142
123
117
114
88
88
87
79
79
76
76
74
71
67
59
57
54
54
52
50
50
50
48
43
43
43
41
40
40
40
38
38
36
36
36
33
33
33
33
31
31
31
31
29
28
26
26
26
26
26
26
26
24
24
24
24
24
21
21
21
19
19
17
17
17
17
14
14
14
14
14
14
14
12
12
12
12
12
12
12
12
12
12
12
12
12
12
12
12

男の子

346
339
255
230
211
178
124
117
115
83
80
78
72
67
59
54
52
52
50
46
44
43
39
39
39
37
37
35
35
35
33
33
駿33
31
28
28
28
26
24
24
20
20
20
20
20
17
17
17
15
15
15
15
13
13
13
13
13
13
13
13
13
13
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11

*1:こないだ案出したら妻に却下された