なたで日記

いろいろな思ったこと書きますヽ(^▽^ゞ) by natade

Posts Tagged ‘思考

交通事故による死亡者数の調査

leave a comment »


交通事故による死亡する人が愛知県がトップです。
私が自動車学校を卒業するときも、交通事故を起こさないように作文を書かされました。
なんで、交通事故が多いのか、県別のデータがいろいろあったので調査してみました。

まず、データを集めます。
事故に関係がありそうなデータに狙いを決めて集めます。
重要なのは県別、最新データであるということです。
中々県別というのは見つかりませんが探しましょう。
人口、車の台数、道路の総延長、面積、高齢者の人数など集められました。
電車の運賃が高いと、車乗る人が多いと思ったのですが、電車の運賃に関するデータはありませんでした。

とりあえず集めたデータは、次元が異なる(人数と面積を比べられない)ので標準化が必要です。
標準化とは分散が1、平均を0にすることです。
サンプル(PDF)

次に、正規化したデータを使用して、死亡順のに降順ソートします。
降順ソート(PDF)
これをみることで、交通事故死亡者数が多い県は、どの項目が大きくなっているか分かります。

より正確に、関係性を調べるため正規化したデータから共分散行列を作成します。
相関係数を作ることで、より統計学的に調べられます。
相関行列(PDF)
これを見ると、相関係数が0.94と最も高いのが乗用車数の数ということが分かります。
つまりこのデータからは、乗用車数が多い県=交通事故の死亡者数が多いと言えます。

改めて、死亡者数の降順ソートを見ると、たしかに乗用車数が関係があることが分かると思います。
ただ、福岡県は乗用車数が少ないのに比べて事故が多いようです。
他の原因があると思います。恐らく人口が多いのが2番目の原因だからでしょう。

もっとたくさんの県別のデータがあればより色々とわかると思います。
重回帰分析を行う場合は、それぞれのデータ同士の相関が大きいため、正確な情報を引き出せないと思います。
一度、主成分分析で調査しKL変換で次元数を減らしたうえで調べる必要があります。

また、実際は相関係数などを調べた場合、その値が妥当かどうか調べる必要があります。
例えば、サンプルの数が少なければ、正当性が小さくなります。
調べた値にあった統計手法を利用して、検定をしましょう。

今回使用したデータを他の人でも調べられるように公開することも必要です。
調査にしたデータ(XLSX)

Written by なたで

2013年8月3日 at 20:21

カテゴリー: memo

Tagged with , ,

なめるとは

leave a comment »


電車の中で、知らない人物の会話を耳にすると
「すぐに謝ると、なめられる」
と主張していた。

また、「なめてんじゃねーぞ」
というセリフを耳にしたことがあるが、
どういう意味か深く考えていたことはなかった。

改めてこの機会に考えてみようと思う。

まずよく耳にするのは
「テストなめてたー」
みたいな物や概念に使う場合である。
この場合は、「油断していた」
「簡単だと思っていたが難しかった」
という意味で使っているのだろう。

「仕事なめてたー」
なら「仕事が思ったより大変だった」
とかそういう意味だろう。

「テストをなめる」
この場合は、A. 「テストなんて余裕余裕」
他の場合に、B. 「態度が悪い感じうける」
2つの意味があると思われる。

「仕事をなめる」
この場合も、A. 「仕事なんて余裕余裕」
他に、B. 「態度が悪い感じで仕事をする」

ここで、B. の「態度が悪い」というのは
「なめた態度」とも呼ばれている。

従って、B. の意味で使う場合は、
「テストをなめた態度でうける」
「仕事をなめた態度でうける」
上記のような文章を省略しているものと考えられる。

さて、ここで最初に戻ろう。
「人物をなめてた」
と「物」ではなく「人」の場合はどうなのだろうか。

この場合は、
「人物が思ってた以上に優っていた」

そういうことだろう。
この「勝る」というのは、人によって例えば、
「勉強ができる人だった」
「サッカーがうまい人だった」
とまちまちである。

では、
「すぐに謝ると、なめられる」
とはどういう意味でのなめられるだろうか
これは先ほどの「なめた態度をとられる」
と同じだと思われる。

つまり、「すぐに謝ると、態度が悪く扱われる」
ということを、その電車の乗客の人は主張していていたのだろう。

ところで、「態度が悪く扱われる」とはどういうことなのだろうか。
これは、次のようなことを指すと仮定する
・「尊敬語」「謙譲語」「丁寧語」を意識しない。
・「ちっ」って言う。
・怒った表情をする(眉をひそめる)
・怒ったしゃべり方をする(大きな声で、高い声を出す)
・大げさな動作をする

もし、上記のことを「態度が悪い」と考えると。
「すぐに謝ると、態度が悪く扱われる」というのは、
私は間違っていると思います。

次に、
「なめてんじゃねーぞ」
とはどういう意味だろうか。
これも、上記のように
「態度を悪くしてるんじゃねーぞ」
という意味でとらえるのだろうか。
しかし、一般的に、態度を悪くしていないのに
「なめてんじゃねーぞ」
と言っている場面とか、想像つく。

となると、
「なめてんじゃねーぞ」
は、どういう意味なのだろうか。
これは使用されている場面から言えば、
「私はあなたが嫌いだ」という意味だろう。

つまり、
「なめてんじゃねーぞ」
の返し文句として
「なめてません」
というのではなく、
「すみません」
と謝るのが正解なのである。

でも、
「すぐに謝ると、なめられる」
っていう考え方の人に
「なめてんじゃねーぞ」といった場合、
上記のように謝ると、逆に「なめられて」しまう。
しかし、謝らないと自分が「なめて」しまう側になるという
不思議なことが起きる。

これは一体どういうことなのだろうか。
詳細は、追って報告したい。

Written by なたで

2012年1月28日 at 17:52

カテゴリー: memo

Tagged with , ,

プログラミングのアイデア1

leave a comment »


適当に思いついたプログラミングアイデアのメモ。

・オートフォーカス
オートフォーカスとはカメラのピントを自動で合わせるもの。
ピントがあっているということは、画像がクッキリしているということ。
クッキリしているということは、高域の周波数成分が大きいということ。
ということで、ピントを段々いろいろと試していって、
もっとも高域の周波数成分が大きくなるところを探す。
そこがピントが合っている部分と考えられる。

・文章をスキャナで取り込んだ画像の傾きの自動補正
画像を大津の判別分析法とかで2値化する。
2値化した画像に対して、毎行(x軸方向)ごとの黒色の値をカウントする。
このx軸方向にカウントした値の列をベクトルとみなす。
ここで、画像が傾いている場合は、このベクトルの各値が滑らかなにつながっていると予想される。
従って、あらゆる傾きに対して、上記のベクトルを調べる。
このベクトルの中で、もっとも高周波数成分が含まれる傾きが、
画像が水平になっていると思われる。

・文字列のあいまい検索
検索したい文字列を X
Xを用いて検索する文章を Y
まずXに含まれるワードを保存しておく。
(漢字とか、カタカナとかでワード判定。あるいは辞書を使う。)
Yに対して、文章を句読点で区切りを分ける。
各文章ごとに、上記のワードを調べる。
全てのワードが含まれていれば、その文章に検索したい情報が含まれると考えられる。
あるいは、Y全体に対して上記のワードがどこに含まれるか調べる。
ワードが集中している箇所が、Xのことが書いてあると考えられる。

Written by なたで

2012年1月28日 at 16:58

第1回涙目ニュース速報スレッド調査

leave a comment »


前々から一度やってみたかったニュース速報の第1回スレッド調査をします。
この調査は、個人的にやっており正式なものではありません。


方法

2ちゃんねるの『涙目ニュース速報@2ch掲示板 2ちゃんねる壊滅、元に戻るのは・・・二年かかる』板の
スレッドを取得して、上位100スレッドに対して下記の項目に当てはまるか調べます。
それぞれの項目が当てはまったので悪いとかそういうのが目的ではありません。
知らない人は少ないと思いますが、2ちゃんねるとは日本最大規模の掲示板です。
ほとんどの板で、匿名希望で書き込みされており、匿名が暗に推奨されている特徴を持っています。


項目リスト

タイトル不一致
ソースと全く関係ない内容のタイトル
タイトル嘘
ソースに書かれていない内容
タイトル煽り
タイトルに煽りを入れている
韓国
韓国関係のニュース
中国
中国関係のニュース
日本社会
日本のニュース
コンピュータ
コンピュータ関係のニュース
ゲーム
ゲーム関係のニュース
事故
事故関係のニュース
犯罪
犯罪関係のニュース
アンケート
意見を求めることが目的であることが
あからさまにスレッドタイトルに現れている
ポジティブ
主観的になんか明るくなるニュース
カウント中によく分からなくなった
ネガティブ
主観的に暗いニュース
カウント中によく分からなくなった

.

正直一回目ということで色々項目を考えましたが、
調べていくうちに、これかぶってね?
みたいな項目があったので、それほどまで厳重に調査していません。

例えばアンケートスレッドは、意見を求めることが目的ですが、
「タイトル煽り」も意見を求めることが目的なのでかぶっているといえばかぶっています。

また、実際のソースに「ポジティブ」などの話があったとしても「タイトル不一致」の場合
タイトルはスレッドのお題なので、「ポジティブ」にカウントしてません。
タイトルがポジティブならカウントしますが。

あと、カウント中、「タイトル不一致」と「タイトル嘘」の線引きがよくわからなくなった。
ソースに全く書いていなくて、ソースと関連なくてニュースとも関連ない場合とかは
両方チェックがある場合があります。まあここは主観なので、
今度やるなら、もうちょっと定義をしっかりしたいです。


結果

エクセルデータ(*.tsv)

韓国が多いと思ったのですが、以外に少なかったです。
書き込みでは韓国などにからめるのが多い印象があるので、レス調査もいつかやってみたいです。

ゲーム関連が少なかったのも意外でした。
調査時期にもよると思いますが。
以前はよくゲームのハードのスレッドが立っていた記憶があります。

タイトルに煽りをいれるのはやはり多かったです。
週刊誌のタイトルも煽りを入れないと売れないように、
煽りを入れないとスレッドが盛り上がらないのでしょうがないとも言えます。

スレッド伸び率と、上の項目との相関係数とかも面白そうですね。
ただ伸び率といっても、時間帯によって変わってくるし現実は難しそうです。

タイトルに嘘や不一致は5スレッドに2つぐらいは含まれているようです。
タイトルは、スレッドの主題を決めるものなので、ここは注意したいところです。

項目によっては主観的に決めるのも多かったので、
どのように決めたか気になる方もいると思います。
用意したタブ区切りのデータで自由に検証して下さい。

Written by なたで

2011年10月9日 at 22:38

カテゴリー: memo

Tagged with , , , , ,

同族嫌悪とは 2

leave a comment »


以前、「同族嫌悪とは」という記事を書きましたが、
もう一度改めて考察してみた。
ちょっと書き方が変かも( 一一)


例えばお米の中に虫が湧いたとする。
もし虫を除去できても、他のお米も心配になるだろう。

若者の凶悪な事件が起きたとする。
すると、最近の若者なら事件の犯人ではなくても怖い印象を持つだろう。
この人も事件を起こさないのだろうか、と。

これらの例は、誰しも考えることだろう。
あるグループがあり、その中の一つでも悪い物が見つかれば、グループ全体を軽蔑してしまう。

なぜなのだろうか。
母数などを決めて確率を実際に計算したわけではない。
検定など勿論行なっていない。
でもこのようなニュースを聞くだけで、対象が属しているグループ全体が
対象と同じような特徴を持つと錯覚してしまうのだ。

実際は自分が認識しているようなことが、案外間違っていることも多いのかもしれない。

こんな話を続けてきたが、認識してしまう側には今回は着目しない。
今回焦点を当てたいのは、グループの中にいる人たちである。

グループに属する物たちは、自分以外の人が不祥事を起こすのを
出来れば避けたいと考えているだろう。
なぜなら、1人でも不祥事が出れば自分もそのグループに属しているので、
同じような不祥事を起こす仲間だと思われてしまう。

自分は何もしていないのに、ある一人だけが不祥事を起こして、
自分も非難の対象となったとしたら、その不祥事をした人を攻めるだろう。
その不祥事をした人のせいで、世間の目が冷たくなった。どうしてくれるんだ。と。

そういう時にネット上で、「不祥事をした人を攻める人」に向かって発言する単語がある。
それが「同族嫌悪」というネットの俗語なのではないかと思う。

「不祥事をした人を攻める人」も同じグループに属しているんだ。
客観的な根拠はないけど、こいつも同じような人物だろう。
そういう人に責める言葉として、「同族嫌悪」があるのだ。

同族が、自分が属しているグループの中で不祥事を起こした人を差している。
同族嫌悪とは人間にとって、誰しもが持っているごく普通の感情だと言えるのではないだろうか。

Written by なたで

2011年8月7日 at 21:35

カテゴリー: memo

Tagged with , , ,

「いきがう」とは

leave a comment »


最近わからない単語がありまして、例えば、

strongesttheleoさんのYahoo知恵袋による投稿
どうして今の中学生はあんなにもいきがっているんですか?2年程前、僕が高校に登校…
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1420293504

globemao2さんのYahoo知恵袋による投稿
30後半~50代のいきがった人がネットに多いみたいですが 今の時代は年とか関…
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1335469438

匿名希望(名無しさん必死だな)の2ちゃんねる(匿名推奨掲示板サイト)による投稿
3DS、PSPを抜く!いきがってたPSW信者どうすんの?
http://kamome.2ch.net/test/read.cgi/ghard/1303311763

いきがって」「いきがった」みたいな単語です。
これは一体どういう意味なのでしょうか。

ちなみに、国語辞典(goo辞書exite日本語俗語辞書)には「いきがって」や「いきがう」でも見つからないです。

ここでヒントと成るようなサイトを見つけました。

いきがったー
http://shindanmaker.com/3238

ここには「あなたが粋がってヤンキーの真似事をした時の姿を診断します。」と書いてあります。
漢字で書くと「粋がう」って書くようですね。
「いきがう」とは「ヤンキーの真似事をしている」という意味なのでしょうか。

「どうして今の中学生はあんなにもいきがっているんですか?」の書き込みの中にも
>どうして今の中学生はあんなにもいきがっているんですか?
>2年程前、僕が高校に登校してると、いきなり中学生5人に絡まれました。
>そのうちのリーダー? みたいなやつが僕に悪口を連発してきた
>ので、チャリから降りて相手の胸倉を掴んだらいきなり敬語で謝ってきました。意味不明です。

と、書いてあるので、やはり「いきがう」とは「ヤンキーの真似をする」
つまり、「ヤンキーの真似をしているだけで、本心ではヤンキーではない。」
「イジメにあいたくないから、自分を強くみせている。」というような感じ。

ただ、ベクトルが少しおかしな方向に向かって、
特に「ヤンキー」という恐れられている存在になることで、
周りを脅かしてしまっている。

というわけで辞書っぽく書くと

いき‐が・う〔‐がふ〕 [粋がう] [動ワ五(ハ四)]
弱者と思われないように、みかけで人を脅すこと。

ところで、ネットでいきがうってどういう意味なんだろう。
みかけ以外をネット上で証明するのって結構大変だと思う。
まあそもそも「脅す」っていうところが反感を持っていけないことだと思うけどうん。

とここまで書き込んだのですが、さらに色々と調べた結果、なんと普通に辞書にありました

粋がる」 いき‐が・る【粋がる】
[動ラ五(四)]粋だと思って得意にになる。また、虚勢を張る。「薄着で―・る」

たしかに「粋がって」なら「粋がう」じゃなくて「粋がる」ですね。

ちなみに粋(いき)とは
いき – Wikipedia
>いきとは、江戸における美意識(美的観念)のひとつであった。
>江戸時代後期に、江戸深川の芸者(辰巳芸者)についていったのがはじまりとされる。
>身なりや振る舞いが洗練されていて、格好よいと感じられること。また、人情に通じていること、遊び方を知っていることなどの意味も含む。
という言葉で、日本特有の言葉だそうです。

虚勢を張るとは
Yahoo!辞書 大辞泉 国語辞書 虚勢(きょせい)を張・る
自分の弱い所を隠して、外見だけは威勢のあるふりをする。からいばりをする。「弱いくせに―・る」

さっきのネット上の3つの例では「虚勢を張る」の意味で使ってたのかな。
「虚勢を張る」だったら、自分が作った意味と同じような感じがする。

Written by なたで

2011年7月10日 at 22:29

カテゴリー: memo

Tagged with , ,

トーシロとは

leave a comment »


最近、トーシロって言葉をよくネット上で見かけるようになりました。
トーシロってどういう意味か分からなく、調べたので報告します。

トーシロとは、ズージャ語で素人という意味だそうです。
Wikipedia(ズージャ語倒語)によると、1980年末から1990年代初頭に使用された言葉だそうで、
ジャズージャと言葉をモジッたことから、こういう用語をズージャ語と呼ぶようになったそうです。

なぜこのように言葉を変えたかというと、
一般人には悟られないようにしたかったようです。
つまり、自分たちの業界以外の人間には伝わらないように、
あるいは仲間意識を高めるために作られたのです。

ではなぜ、ネット上でこのように一般の人には分からないような言葉を使用したのでしょうか。
今回のトーシロという言葉は、年代的に年がある人しか通じないように思えます。
このことから、自分の年を暗に伝えたかったのではないか、
または、トーシロという言葉使いに突っ込んでもらいたい(反応してもらいたい)という下心があり、
一種の煽りのために使用したのではないかと考えました。

ちなみに、あとから分かったのですが、大辞林 第二版 (三省堂)には「とうしろ」が登録されていました。
(引用します)
>とうしろ 【藤四郎】
> 〔「しろうと(素人)」をひっくり返し、人名めかした語〕素人(しろうと)。とうしろう。
藤四郎と書くというのはびっくり知りました。
人名のようにするという効果もあるようですね。

Written by なたで

2011年4月6日 at 21:38

カテゴリー: memo

Tagged with , , ,