R

国勢調査のデータと R を使って結婚について考える

未婚のアラフォー、堀内(♂)です。

弊社は恋愛をテーマとする会社であるためか、我ら技術部のメンバーも既婚だったり、同棲していたり、恋人持ちだったりする割合が多いようです。僕が新卒で入った技術100%みたいな会社の壊滅的な状況と比べると異次元です。まあ、技術部は30代が多いですしね。みな結婚を考える時期です。

部署の外に目をやると、イベント系の方々がたくさんいます。弊社は基本的にイベント会社なのです。新卒でも恋人持ちが多いらしく(伝聞:あまり話したことがない)、そのリア充ぶりに卒倒しそうです。そんな中で、僕に恋人がいないのは日本の政治が悪いに違いなかろうと、国勢調査のデータを調べてみることにしました。ツールは R です。

まず、「国勢調査の配偶関係データを R で取得する」で作成した、都道府県別の婚姻状況データを読み込みます。このデータは、15歳以上の日本の居住者を、都道府県毎、年齢毎、性別毎に、「未婚」「離別」「死別」「配偶関係不詳」「有配偶」に分けて記載しています。一般的には未婚、既婚の2分類を使いますが、国勢調査では婚姻関係を結んだ後の離別(離婚)と死別(配偶者の死亡)も区別しています。

[code lang=”r”] census <- read.csv(‘prefs.csv’)
attach(census)
census$age <- as.integer(sub(‘歳.*’, ”, age))
census$area_code <- as.factor(area_code)
census$area <- ordered(area, levels=unique(area))
census$marital_status <- ordered(
marital_status,
levels=rev(c(‘未婚’, ‘離別’, ‘死別’, ‘配偶関係「不詳」’, ‘有配偶’))
)
detach()
[/code]

このデータは、全人口と、日本人の人口の両方を持っているので、外国人比率も参考までに押さえておきましょう。

[code lang=”r”] num_of_all <- sum(census[census$nationality==’総数(国籍)’,]$value, na.rm=T)
num_of_japanese <- sum(census[census$nationality==’日本人’,]$value, na.rm=T)
print(sprintf(
‘全人口は %s 人、外国人居住者は %s 人で、全体の %f %% を占める。’,
prettyNum(num_of_all, big.mark=’,’),
prettyNum(num_of_all – num_of_japanese, big.mark=’,’),
(num_of_all – num_of_japanese) / num_of_all * 100)
)
=> [1] "全人口は 109,754,177 人、外国人居住者は 2,129,711 人で、全体の 1.940437 % を占める。"
[/code]

全人口1.1億というのは少ないと思われるでしょうが、このデータには15才未満が含まれていないのです。婚姻関係を追うものですから。

15歳で結婚

参考までに、15〜18才の婚姻状態を調べてみましょう。

[code lang=”r”] census %>%
dplyr::filter(age <= 18, nationality == ‘総数(国籍)’, marital_status == ‘有配偶’) %>%
na.omit() %>%
group_by(gender, age) %>%
summarize(population=sum(value)) %>%
spread(gender, population)
[/code]

15歳の女性が144人、男性が86人も配偶者を持っているのですね。民法では女性16歳、男性18歳から婚姻が認められますが、国勢調査の「有配偶」は、届出の有無に関係なく、実態を表しています。事実上、周囲から夫婦であると認められている状態です。一般的な言葉で言えば「事実婚」です。

続きを読む

国勢調査の配偶関係データを R で取得する

平成27年国勢調査のうち、配偶関係(婚姻関係)のデータを R で取得します。ここでは estatapi パッケージを使います。appId は、e-statのサイトで事前に取得しておきましょう。

[code lang=text] library(estatapi)
statslist %>%
dplyr::filter(grepl('平成27年.*配偶', STATISTICS_NAME)) %>%
select(`@id`, TITLE) %>%
mutate(TITLE=substr(TITLE, 0, 50))
[/code]

求めるデータの @id が 0003149791 であることがわかったので、メタ情報を取得します。

[code lang=text] metainfo <- estat_getMetaInfo(appId='xxxxx', statsDataId='0003149791')
metainfo
[/code] [code lang=text] metainfo$cat04
# A tibble: 10 × 3
@code @name @level

1 0000 総数(配偶関係) 1
2 0010 未婚 1
3 0020 有配偶 1
4 0040 死別 1
5 0050 離別 1
6 0070 配偶関係「不詳」 1
7 0080 (配偶関係別割合(%)) 未婚 1
8 0090 (配偶関係別割合(%)) 有配偶 1
9 0110 (配偶関係別割合(%)) 死別 1
10 0120 (配偶関係別割合(%)) 離別 1
[/code]

メタ情報には、様々な「コード」が入っています。上記はカテゴリ04(cat04)のコードの例。

データ取得時間短縮のため、メタ情報の @code を用いて絞り込んだデータを取得します。データ取得には数分かかります。

[code lang=text] census <- estat_getStatsData(
appId='xxxxx',
statsDataId='0003149791',
cdCat02=c('0010', '0020'), # 男、女
cdCat04=c('0010', '0020', '0040', '0050', '0070'), # 未婚、有配偶、死別、離別、配偶関係「不詳」
cdCat05='00710' # 全域
)
census$tab_code <- NULL
census$表章項目 <- NULL
census$cat01_code <- NULL
census$cat02_code <- NULL
census$cat03_code <- NULL
census$cat04_code <- NULL
census$cat05_code <- NULL
census$`全域・人口集中地区(2015)` <- NULL
census$time_code <- NULL
census$`時間軸(年次)` <- NULL
names(census) <- c('nationality', 'gender', 'age', 'marital_status', 'area_code', 'area', 'value')
census <- census[!grepl('総数|平均|再掲', census$age),] census <- census[!grepl('市部$|郡部$', census$area),] attach(census)
census$nationality <- as.factor(nationality)
census$gender <- as.factor(gender)
census$age <- ordered(age, levels=c(paste(15:99, '歳', sep=''), '100歳以上'))
census$marital_status <- as.factor(marital_status)
census$area_code <- as.factor(area_code)
census$area <- as.factor(area)
[/code]

都道府県別、都市別のデータを取り出します。

[code lang=text] census_prefs <- census %>%
dplyr::filter(
area_code != '00000',
as.numeric(levels(area_code))[area_code] %% 1000 == 0
)

census_cities <- census %>%
dplyr::filter(as.numeric(levels(area_code))[area_code] %% 1000 != 0)
[/code]

今後の利用のために CSV で保存しておきます。

[code lang=text] write.csv(census_prefs, 'prefs.csv', row.names=F)
write.csv(census_cities, 'cities.csv', row.names=F)
[/code]

この中に入っているデータは、こんな形式のものです。


リンクバルでは、Ruby と React と R を使って世の中をハッピーにしたいエンジニアを募集中です。この記事にピンと来た方は、是非ご応募ください。