知らないのか?おそらく知っていてやっている酷い「勤労統計」

こんにちは。

昨日、帰宅して普段は付けないテレビをつけたところ勤労統計問題のニュースが流れていました。

官邸への忖度?厚労省の勤労統計調査「捏造」を指示したのは誰か

もうね、このニュースはさすがにひど過ぎる。

「どうせ国民なんてアホだからバレないだろw」って思われているのと一緒ですよ。

このデータ時代とも言われる現代で、統計調査を誤魔化すなんて…だから老害なんて言われてしまうんだ。

データは嘘をつかないですし、量があればあるほど良い。

それを知ってか知らずか、「統計」という言葉に任せて適当にしすぎです。

何が問題なの?

統計を取る、という方針は間違いではないのですが、統計の取り方に問題が多ありです。

メディアでも報道されているように、こういったデータは基本的に「全数調査」を行ってこその意味があります。

しかし今回のデータ抽出は「標本調査」によって統計が取られています。

集合で表すと「標本 ∈ 全数」となり、いくつかの標本の和集合が全数(=母集合)となります。

つまり全部ではなく、一部のデータだけを持ってきて「これがを全体だとしよう」と勝手に決めて全体の平均なりを算出しています。

標本抽出は「無作為に決めた標本」であれば誤差こそあれど、全数調査に近い結果が出ることが多いです。

例えば

「1~6まで書かれた紙が100枚ずつ入った箱から60枚を取り出す」

を何万回も行って、その合計の平均値を求めるとします。

その試行のうちの1つを何も考えずに取り出せば、おそらく1~6それぞれが大体10枚ずつ入ったような平均がが得られます(10+20+30+40+50+60 = 210前後)。

ただし今回は「作為的に決めた標本」であるため、結果が大きく変わってしまいます。

上に挙げた例でいうと

「この試行は6が60枚出ている!これを標本としよう!」

という事もできてしまいます。

リセマラと同じ事ですよね。(最初からリセマラの例で紹介すればよかった)

こんなアホみたいな統計が意味をなさないことはお分かりいただけたと思います。

しかしこういう事をして公開していたという事です。

こんな極端にはしていないですが、例えば

「こことここのデータを入れ替えれば、昨年度より上がっているように見える」

と意図的に標本を変えることができ、これを補正という最もらしい言葉で押そうとしています。

そりゃ全数調査されたら酷い統計を出していたことがばれるので、情報は消しますよね。

私でもそんな方法取ったらおぼっちゃいますよ。(死語)

この問題、韓国の問題と同じくらい大きな問題だと個人的には思うわけですよ。

だってこの調査が正確に行われた結果、賃金上昇が低い値だったとしたら増税なんてできないですよね?

収入が増えていないのに増税するなんてわかったら与党への批判が増えますからね。

まぁおそらく情報を消すくらいなんで、ここ数年の賃金上昇は良い所で停滞、最悪は下がり続けているでしょうね。

出なきゃデータを紛失(消す)意味がないですからね。

こういったデータは社名を隠して公開した方がいいと思うんですけどねー。

今年から公開して増税は先延ばしにして、今年からの2~3年のうち1年でも下がったときには増税は取りやめにすべきです。

必要であれば減税も考えた方が良いレベルだと思います。