5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

統計学なんでもスレッド5

1 :132人目の素数さん:2006/04/18(火) 21:18:41
前スレ
統計学なんでもスレッド4
http://science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
http://science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
http://science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
= 統計解析フリーソフト R =
http://science3.2ch.net/test/read.cgi/math/1062650510/

2 :132人目の素数さん:2006/04/18(火) 21:20:30
= 統計解析フリーソフト R =
http://science4.2ch.net/test/read.cgi/math/1062650510/

3 :132人目の素数さん:2006/04/18(火) 21:22:20
多変量で、多元グラフ(3次元以上)をかけるやつない?

4 :132人目の素数さん:2006/04/18(火) 23:12:50
いきなり質問なんですけど
ヒズミが極端に大きい場合の分布はどのようになるのでしょうか?

5 :132人目の素数さん:2006/04/19(水) 08:20:01
帰無仮説ってなんでこういう名前なのか教えて欲しい。
英語の直訳ってのは分かるんだけど、そもそも直感的に分かりにくい。

対立仮説は口語っぽいし直感的だし。

「おまえとは対立したくない」とは言うけど
「おまえとは帰無したくない」とはいわないし。。。



6 :132人目の素数さん:2006/04/19(水) 13:10:28
無に帰すから金仮説(なぜかマジで変換できない)

7 :前スレ991:2006/04/19(水) 15:35:47
レスつく前に埋まってしまったので、こちらでお願いします。

カイ二乗分布に従っているデータを正規分布に従うように
変換する方法ってありますか?
あればその方法を教えてください。
なければ、この変換方法は今後も開発されることはないものなのか
(理論的に無理なのか)教えてください。

8 :132人目の素数さん:2006/04/19(水) 22:39:42
統計解析初心者です。統計解析の内容そのものの質問では無いですが、予算15万以下で統計解析ソフトを購入しようと思います。比較的高機能で、初心者が使いやすいソフトで、お勧めのものはあるでしょうか?

9 :132人目の素数さん:2006/04/20(木) 02:43:13
とりあえずR
タダ

物足りなくなったらS

10 :132人目の素数さん:2006/04/20(木) 09:52:59
Rは初心者には向かないやろ。
金出すんならJMPかな。


11 :132人目の素数さん:2006/04/20(木) 12:54:44
用途にもよるけど
・gretl


12 :132人目の素数さん:2006/04/20(木) 20:32:51
>>8
excel/calc

13 :132人目の素数さん:2006/04/21(金) 03:19:31
日本人しか使ってるのみたことないけど
GAUSS


14 :132人目の素数さん:2006/04/21(金) 09:17:05
アゼルバイジャン人キタ━━━━━━(゚∀゚)━━━━━━ !!

15 :132人目の素数さん:2006/04/22(土) 22:58:10
>>5

今はあんまり使われなくなりましたが、

「ゼロ仮説」

って言い方もありますよ。


元々学問用語なんて英語の直訳でヘンな訳が多いし、統計自体も日本の学者の世界的な貢献なんて
ほとんど無いからしょーがないかもね。

16 :132人目の素数さん:2006/04/22(土) 23:02:42
>>7

これ試してみたら?

T得点:
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/normdist/hensati.html

これが貴方が望んでるモノかどうかは正直分からんけど。

17 :132人目の素数さん:2006/04/23(日) 13:37:25
>>7
カイ自乗からガウスって非線形変換だよね。
それやって意味あるのかどうか?

コンピュータで乱数を作るとき
一様乱数から他の乱数作るにはよくやるけど。

18 :132人目の素数さん:2006/04/23(日) 17:04:45
>>7の問題について
>>16
順位を通して正規化しているので元の分布は問わないようだね。
あくまでもカイ2乗からにこだわるなら少し違うかな。

>>17
確かに意味があるのかどうかが重要だね。
一様分布を経由すればどんな分布も正規分布に従うように
変換できるが、なぜ元のままのカイ2乗ではいけないのか
なぜ変換にこだわるかが分からないね。

>>7の質問が元々平均0の正規分布に従うデータを2乗したら
カイ2乗分布に従うようにできるが、それを元に戻せるかという
意味だったら無理というのが答だな。


19 :132人目の素数さん:2006/04/23(日) 20:35:11
>>16-18ありがとうございます。

正規分布だと
1σ以内に68%
2σ以内に95%
3σ以内に99%
と言えますよね。
ひとつは、これが言いたいです。
自由度nのときσ=√2nを使って
1σ以内にxx%入っている
という風に。

もうひとつは、左右対称になる分布にしたいです。
今は、明らかに対称でない分布(自由度n=3〜5程度のカイ二乗)を
正規分布と仮定して話を進めているので。

上記二つが目的なのですが>>16のサイトの方法でいいのでしょうか?

対数正規分布のようにも見えるのでlogをとって無理矢理正規分布に
しようかとも考えているのですが。

>>18
元に戻せるかという意味ではないです。



20 :19=7:2006/04/23(日) 20:36:08
>>19=>>7です

21 :132人目の素数さん:2006/04/23(日) 21:42:20
>>19

> 自由度nのときσ=√2nを使って
1σ以内にxx%入っているという風に。

いや、これは言えるんじゃないかな?ただ必要ないから誰も言わないだけで(笑)。
例えば、自由度3のχ^2分布だと、平均3、標準偏差2.449490として、

χ^2=3+2.449490の点の上側確率⇒0.1416911
χ^2=3−2.449490の点の下側確率⇒0.09233764
∴平均±σには全体の77%が含まれる

とかね。
基本的には理論分布は端の確率しか使わないから言わないだけでしょ。
(あと負の値取れない例があるから言わないんじゃないでしょうか?)

>明らかに対称でない分布(自由度n=3〜5程度のカイ二乗)を
正規分布と仮定して話を進めているので。

その仮定が成り立つか成り立たないか以前にそれは現実のデータに合わせたんですか?
適合度検定してみての結論ですか?
明らかに正規分布に合わないのに、正規分布仮定して話を進めると無理が生じると思いますよ。

>>16は試してみないと何とも言えないです。
今のところ、何がやりたいのかイマイチ把握していないので。


22 :19:2006/04/24(月) 00:32:05

>>21

>∴平均±σには全体の77%が含まれる
よく分かりました。
ありがとうございます。

(ある特定の統計解析をしたいというよりも)
正規分布を仮定した上で進める統計処理が多く、
目安として自由度nが30以上のカイ二乗分布は正規分布で近似できる
ことは分かったのですが、
n=3〜5程度のカイ二乗分布に従うデータでも、正規に従うように
変換できれば、色々な統計処理が進められるので、変換したい
というのが目的です。
(少なくとも左右対称な分布にはしたいです)

>明らかに正規分布に合わないのに、正規分布仮定して話を進めると無理が生じると思いますよ。
正規性の検定はしてないのですが、間違いなく正規ではないデータを正規分布と
仮定してしまっています。
正規性を仮定しないと話が進められない場合には、正規変換もできないと、
無理を承知で正規を仮定せざるを得ないと思うのですが。


23 :132人目の素数さん:2006/04/24(月) 01:26:14
>>22

確かに正規性仮定した方法論は多いですよね。
取り合えずT得点に変換してやってみればイイとは思いますよ。
統計解析はどの道現実のデータ相手に必ずしも成功するわけではないですし、
不具合が見つかるのも大事な分析過程だとは思いますんで。

24 :132人目の素数さん:2006/04/24(月) 01:46:18
( Σ )

25 :18:2006/04/24(月) 11:24:51
>>22
>>23
T得点で正規分布を仮定した分析をするというのは結局ノンパラと同じようなものなので
素直にノンパラの方法ではだめなのかと思いますね。
相手が1群ならともかく多群ならT得点では無理ですしね。


26 :132人目の素数さん:2006/04/24(月) 12:23:15
>>25

いずれにせよ、その「χ^2に従うと思われる」データを見てないんで、何とも言えないんですよね(苦笑)。
ヒストグラムとか作ったんでしょうかね?オーソドックスには取り合えず多項分布化してみてからあれこれ仮定を
始める、ってのがテだとは思うんですけど・・・・・・。
この状況じゃ良く分かりませんね(笑)。

27 :22:2006/04/24(月) 13:03:26
>>23 >>25-26
色々とアドバイスありがとうございます。

データは1群なのでT得点でやってみようと思います。
どうしても「データが正規分布する」という前提があるので
ノンパラは今までは考えてなかったです。

データはヒストグラムにしてみて(検定はしていないのですが)
カイ二乗のように見えました。
生のデータなので諸事情で公開できなくて申し訳ないです。


28 :132人目の素数さん:2006/04/24(月) 13:38:52
>>27

>カイ二乗のように見えました。

確かに「見えた/見えない」ってのは大事ですよね。
ところで離散型ですか?ポアソン分布は試してみました?
多分自由度3〜5辺りの「χ^2分布に見える」って事はポアソンにも見える、
とも言えると思うのですが・・・・・・。

29 :27:2006/04/24(月) 14:06:13
>>28
データは連続型です。
形はパラメータλ=2〜3程度のポアソン分布(確率変数x)にも見えます。
ポアソン分布だとλが小さくても正規近似できるみたいですね。
(実際のデータはx=0をとらない場合もあるので、その場合にはポアソンは
まずいかもしれません。)
問題は横軸のxのとる値が整数とは限らないことです。
xに実数を入れても問題なければ解決しそうな気もするのですが。
確率関数[e^(-λ)*λ^x]/x! はx≧0が実数でも計算はできるようなので。

30 :132人目の素数さん:2006/04/24(月) 22:26:20
コーシー分布のモーメントが存在しないのは何故ですか?
級数1+(1/2)+(1/3)+(1/4)+...が収束しないのと同じ理由といいますが、
良くわかりません。


31 :132人目の素数さん:2006/04/25(火) 21:27:10
二項分布を正規分布で近似するときに0.5の調整をするのはなぜですか?

二項分布の確率は高さ、正規分布の確率は面積だとすると
プラスマイナス0.5の調整をすることで正規分布の確率(面積)が二項分布の高さ×1になり
二項分布の確率とちかくなるという理解でいいのでしょうか?

32 :132人目の素数さん:2006/04/26(水) 01:11:20
>>30
モーメントの定義に従って計算すると発散するからとしか言えないのでは?
それは積分だが、その級数と計算が似ているのでそう説明されたのでしょう。

>>31
そうですね。柱は中心から0.5はみ出て立つことになるのでそれを補正した方が
面積が近くなるという理解で正しいです。

33 :132人目の素数さん:2006/04/27(木) 11:21:24
すみません教えてください。
対数正規分布のパーセント点ってどう求めるのでしょうか?
μ+zα σの指数変換でよいのでしょうか?
お願いします

34 :132人目の素数さん:2006/04/27(木) 12:38:38
すごく初心者的な、おそらく的外れな質問で申し訳ないのですが、
中心極限定理について質問させてください。
最尤推定量の漸近有効性は
√n(\hat{θ}_n−θ) → N(0,I(θ)^{-1}),
where \hat{θ}_n:最尤推定量,θ:真のパラメータ(ベクトル),
と記述されますが、これは最尤推定量に√nをかけたものの
漸近分散(共分散行列)がI(θ)^{-1}だということですよね?
すると、最尤推定量そのものの漸近分散はどうなるのでしょう?
0になるんでしょうか。そんなはずもなさそうなんですが・・・。
どなたかよろしくお願いいたします。

35 :132人目の素数さん:2006/04/27(木) 22:12:13
便乗質問
漸近分散ってどういう意味をなすんですか?
無限回推定したときの分散って意味?
でもサンプルサイズのnを無限大に飛ばしてるんだよね?
無限大のサンプルをつかって推定したとするなら、
何回も推定するって意味じゃないですよね。
無限大のサンプルつかって一回だけ推定するなら,
分散の意味自体がわからない・・・。
誰か教えてください。

36 :132人目の素数さん:2006/04/27(木) 22:51:13
>>33
いいんじゃないかな。

>>34
データが増えると推定量は真値に近づくので
分散が0に行くのは自明では。

>>35
データ数が増えると推定量の分散は0に行くけどその行き方に違いはある。
それがルートn倍すると見えてくるけどその意味は、大きなデータを取ったときに
早く安定するのかどうかの違いということじゃないかな。


37 :33:2006/04/27(木) 23:21:08
>36
ありがとうございます。
単純にこれでいいのかなと不安になりまして・・・

38 :35:2006/04/27(木) 23:46:24
>>36
んー、その推定量が安定しているかの測度という感じですかね?
推定量Aと推定量Bの漸近分散を比較してこちらの方が小さいから良い推定量みたいな?
むずかしいですね。ありがとうございました。

39 :132人目の素数さん:2006/04/28(金) 10:39:15
「平均」の統計学的な意味って何ですかね?

40 :34:2006/04/28(金) 13:58:54
>>36
そうですか・・・。やはり、分散は0になるんですね。
早く安定するかどうかということなんですね。
ありがとうございました!

41 :132人目の素数さん:2006/04/28(金) 23:09:21
>>39
統計学的と言われても難しいなあ。
結局、重心という意味しかないのでは?
それともそんなものをなぜ後生大事に使っているのかということかな?


42 :132人目の素数さん:2006/04/28(金) 23:44:38
質問させてください。確率変数Xが標準正規分布に従い,その密度関数をφ(x)とするとき、
1/Xの期待値

∫1/x φ(x)dx

って存在しますか?よろしくお願いします。

43 :132人目の素数さん:2006/04/28(金) 23:46:50
>39
まぁ、単に標本平均っていうならば、一般にいわれる「平均」と考え方は
変わりないんじゃね?


44 :132人目の素数さん:2006/04/29(土) 01:29:18
>>42
発散しますね。


45 :42:2006/04/29(土) 10:23:09
>44
やはりそうですよね・・・.ありがとうございます.

たとえば,正規分布の位置パラメータが
大きく(>0),0以下が生起する確率が非常に低いときでも,0以下になる確率が
0ではないから,0のポイントで発散しますよね.この場合何らかの形
(近似にしろ何らかで抑えるにしろ)で期待値を記述することはできないですかね?


46 :44:2006/04/29(土) 11:39:08
そもそもどういう場合にそんなことが必要なのでしょうか?
xが負なら0近くで−∞に行きますから0を挟んで極端な
挙動を示すのですが。


47 :132人目の素数さん:2006/04/30(日) 05:14:52
分からない問題があるので良かったら回答お願いします
英語の文で申し訳ないのですが・・・
Supervisores were asked to rate the productivity of employees on their jobs. A researcher wishes to see whether married men receive higher ratings
than single men. A rating scale of 1 to 50 yielded the data shown here. At アルファー=0.01 is there evidence to support this claim?
この問題は、The Wilcoxon Rank Sum Test を使って求めなければならないのですが、
Single ... 48, 46, 42, 50, 38, 36, 40, 31, 28, 24, 49, 34
Married ... 44, 35, 41, 37, 42, 43, 29, 31, 37, 32, 36
がデータです。
自分の回答としては、R=122.5
ミュウ=132
ロウ=16.2
Z=-0.586
が出ています。この問題はtwo-tailed ですか?それとも、right-tailed testですか?
もしお分かりであれば、その時のHypothesisも教えてください。よろしくお願いします。

48 :132人目の素数さん:2006/04/30(日) 09:45:12
ロジット変換とは、0 <= y <= 1 のロジスティック曲線を線形化するものですが、
一般的な y が 0 <= y の場合に線形化するためのリンク関数は何と言うのでしょうか?



49 :42:2006/04/30(日) 10:50:24
>44
ご返信ありがとうございます。演習問題とかではなくて、
単に研究していて気になったことなんで、答えとかはないのかもしれません・・・。
例えば、μが十分大きいときには期待値の積分区間を0からにしたら近似的に
大丈夫かなとか思ったり・・・。
答えにくい質問で申し訳ありません。

50 :132人目の素数さん:2006/04/30(日) 11:06:03
標準正規分布に従う独立な確率X,Yがあって、aX^2 + bY^2, (a,bは定数)はどういう分布に従うのでしょうか?
簡単な問題かもしれないですが、これについて書いてある参考文献など教えていただけないでしょうか?

51 :132人目の素数さん:2006/04/30(日) 11:18:26
P(aX^2 + bY^2)=aP(X^2)+bP(Y^2)

52 :132人目の素数さん:2006/04/30(日) 11:21:14
ほかのスレで聞いても返答がなかったので
教えてください

帰無仮定が正しい場合の生起確率Pを求めよ

ある夫婦から5人の子供が生まれ5人すべてが女であった
この夫婦からは女の子が生まれやすいといえるか?

よろしくお願いします


53 :132人目の素数さん:2006/04/30(日) 11:27:55
>49
もっと具体的に.そもそも正規分布でいいのか?

54 :132人目の素数さん:2006/04/30(日) 11:51:11
>>48にも答えてください

55 :132人目の素数さん:2006/04/30(日) 12:02:44
>>47
英語が・・・。他の香具師頼む

56 :132人目の素数さん:2006/04/30(日) 12:19:01
エクセルでやれば?

57 :132人目の素数さん:2006/04/30(日) 12:51:40
>>48の質問はDQN過ぎて答えるに値しないものでしょうか?
本気で悩んでいます。

58 :132人目の素数さん:2006/04/30(日) 13:12:21
こんなよい月を一人で見て寝る

59 :132人目の素数さん:2006/04/30(日) 13:16:26
ロジット変換とは、
0 <= y <= 1 のロジスティック曲線を
線形化するもの

ですが、

一般的な y が
0 <= y の場合に
線形化するための

リンク関数は

何と言うのでしょうか?

名前を聞きたいの?

60 :132人目の素数さん:2006/04/30(日) 13:21:04
47です。
エクセル使ったこと無いので・・・。できれば、どなたか意見をお聞きできたらなと思いまして。
自分では、Ho: There is a no difference. H1: there is a difference. が仮説?になり
two-tailed でテストするんではなかろうかと思うんですが・・・しかし、文面ではone-tailed testのようが気がいたしまして。
よろしくお願いします。

61 :132人目の素数さん:2006/04/30(日) 14:12:40
>>59
名前も聞きたいのですが、それ以前に
0 <= y <= 1 以外でも線形化できるのかどうかも聞きたいです。
お願いします。

62 :132人目の素数さん:2006/04/30(日) 15:35:39
logit transformationの式の制限からy<1がでてるのでは?
y>1のときは式をいじればいいんじゃない?

63 :42:2006/04/30(日) 17:45:23
>>53
レスありがとうございます.
すみません、具体的にいうとかなり長くなるのであれなんですが,
要するに,研究で,正規分布する1/Xの期待値が求まればうれしいという状況なんです.
そういうときに,一般的には何らかの近似が用いられているのかな,と思い質問しました
(たとえば,期待値の積分区間を0からにしてみるとか).
あまりそういう状況はないんでしょうかね.
あまり明瞭でない質問で申し訳ないです.

64 :42:2006/04/30(日) 17:45:54

すみません正規分布に従うのはXです.

65 :44:2006/04/30(日) 20:38:14
>>49
>>63
Xが0も取り得るなら1/Xに意味があるのかということをみんな聞きたいのだと
思います。実は正規分布自体が近似で0や負は取らないと言うことは
ないですか?


66 :132人目の素数さん:2006/04/30(日) 20:40:54
>>59
元の変数がロジスティック分布に従うからロジット変換で線形化できるわけですよね。
一般的な y が 0 <= y の場合とはどんな曲線ですか?
対数線型モデルのことですか?もしそうならリンク関数は単に対数変換ですが。



67 :42:2006/04/30(日) 21:09:09
>>65
すみません,仰るとおりですね.
正規分布自体が近似というわけではないのですが,
ある変換をした後に正規分布に従うという前提なので,
変換前の変数(原尺度)は負値を取り得ないという前提です・・・.
あまり整理もせずに湧き上がった疑問をそのまま書いてしまいました・・・.
お騒がせして申し訳ない.

68 :42:2006/04/30(日) 21:14:27
なんだか読み返すと支離滅裂なことを書き込んでしまいました.
もう一度じっくり整理してみます.お騒がせしました.
しかし,書き込むことや頂いたレスから
自分の中である程度問題の形が明瞭になった気がします.
レスを下さった皆様,ありがとうございました.

69 :44:2006/04/30(日) 21:49:31
>>67-68
対数正規分布とかだったわけですね。それなら1/Xの平均も考えるかもしれませんね。
まあ何にせよ。問題が明確になったのはよかったです。


70 :132人目の素数さん:2006/04/30(日) 22:14:42
>>47

片側検定だと思います。
と言うのも、既婚者が独身者より生産性が高い、と言った事を証明したいらしいから、です。
(A researcher wishes to see whether married men receive higher ratings
than single men.)
つまり、真の目的は

既婚者の生産性>独身者の生産性

で、対立仮説がコレになります。
よって、帰無仮説H_0、は

既婚者の生産性と独身者の生産性には差が無い。
(Null hypothesis: Married men receive same ratings as single men receive.)

でいいと思います。
この場合のwhetherはifと読み替えてみれば宜しいでしょう。

71 :132人目の素数さん:2006/04/30(日) 22:21:37
>>59

「一般的なy」ってのが何を指してるのか良く分からないでしょう。
yなんてのはどうにでも定義出来るので、変換の形も無数にあると思いますよ。

72 :132人目の素数さん:2006/04/30(日) 22:22:22
↑失礼。
>>48でしたね。

73 :132人目の素数さん:2006/04/30(日) 23:45:46
>>70
ありがとうございます。
要するに、
Ho: married men receive less ratings than or equal to single men
H1; married men receive higher ratings than single men
ですよね?
それで、これは片側検定ということで、しかも、右側ですよね?
しかし、自分が得たZ値は -0.586 であり、左側にfall する感じなのですが。
これだとtestできませんよね?それとも計算間違いなのでしょうか?
左側の検定だと、結論がdo not reject the null hypothesisでいいのですが。
よろしくお願いします。おそらく理解してないと思いますので・・・。

74 :47です:2006/05/01(月) 00:00:22
連続ですみませんが・・
70さんがおっしゃっている仮説は以下のようにも読み取れることも可能なのですが・・・。
Ho: There is a no difference between married men and single men in receiving ratings
H1: there is a difference between married men and single men in receiving ratings
なぜなら、null hypothesis では差が無いこと示さなければならないから。
それでおいて、両側検定だと上手くいくのですがね・・・。
すみません、混乱しています。駄目だ・・・。


75 :132人目の素数さん:2006/05/01(月) 00:40:34
>>73

もうちょっと待ってて下さい。アトでRにデータブチ込んで調べてみます。

>>74

これはむしろ英語の問題だと思うんですが。
>>74に書かれているのは確かに「両側検定」ですよね。
ただし、これは帰無仮説がどうの、と言うよりあくまで「英文の解釈」の問題だと思います。
と言うのは、問題文に書かれているのは、あくまで、

A researcher wishes to see whether married men receive higher ratings
than single men.

なんですが、確かにwhether文から見ると通常「〜かどうか」で対立仮説が両側検定になる
んじゃないか、と感じるかもしれません。
ただし、英語の特徴として、(僕が知ってる限りでは)あくまで強調して訊きたいのは

higher ratings

の部分なんですよ。


76 :132人目の素数さん:2006/05/01(月) 00:41:17
と言うのも、仮に対立仮説が両側検定を要求する場合、英文が次のようになってる筈だからです。

A researcher wishes to see whether married men receive same ratings
as single men receive.

これならwhether〜(not)の構文上、同じレイティング⇔違うレイティングと言う対立構造が成立します。
ただし、元々の表記のようだと、あくまで高いレイティング⇔そうじゃないケース、と言った対立構造しか
ありません。その点、英語だと素直に“構文構造”以上の意味は持たないので、日本語に比べて解釈
が容易な筈なんです。
それと、元々の検定のアイディアですが、確かに片側検定だと、

H_0:何かの平均≦他の平均
H_1:何かの平均>他の平均

です。これは間違い無いんですが、この形の帰無仮説ですと検定に用いる分布の形が限定出来ないのです。
そこで代わりに帰無仮説の条件の最大値を利用して、

H_0:何かの平均=他の平均

とするのが通例なんです(だから真意は≦の方にあるんです)。
どっちかと言うと、この場合の“=”ってのは“意味”よりも“計算の都合”を優先しているんです。
(≦の形の検定ですとやりづらいんですよ)

77 :47です:2006/05/01(月) 00:48:14
ありがとうございます。自分もそこが気になってるのは確かなのですが・・・。
The Wilcoxon Rank Sum Test においては、両側検定または片側検定のどちらもが使用可能なのでしょうか?
例題では、両側検定しか使われてないので・・・これが自分を混乱に陥れてる元なのですが・・・。
だから片側検定には違和感が・・・。勉強不足ですみません・・。全ての例題においては
claimが差があるかないかなので、両側検定だと分かるのですが。長々とすみません。よろしくお願いします。

78 :47です:2006/05/01(月) 00:55:19
>>76
わかりました。ありがとうございます。
結論を出すと、右側検定でいいですかね?
仮にそうであるのならば、Z値がマイナスでも、よろしいのかな?
で、答えが、Do not reject the null hypothesis.でOKかな?
すごく助かります。もし違うのであれば指摘してください。お願いします。

79 :132人目の素数さん:2006/05/01(月) 01:45:16
>>78

Rで色々弄くってみたんだけど、どの道帰無仮説は棄却できないようですね。有意水準が0.01でしょ?

結果載せておきますよ。

80 :132人目の素数さん:2006/05/01(月) 01:45:56
> Single <- c(48, 46, 42, 50, 38, 36, 40, 31, 28, 24, 49, 34)
> Married <- c(44, 35, 41, 37, 42, 43, 29, 31, 37, 32, 36)
>
> wilcox.test(Married, Single, alternative="greater", exact=F, correct=F)

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.7208
alternative hypothesis: true mu is greater than 0

> wilcox.test(Married, Single, alternative="less", exact=F, correct=F)

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.2792
alternative hypothesis: true mu is less than 0

> wilcox.test(Married, Single, exact=F, correct=F)

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.5584
alternative hypothesis: true mu is not equal to 0

つまり有意な差は見られませんね。

81 :132人目の素数さん:2006/05/01(月) 01:51:45
こっちの方がマシかな?信頼区間付けてみました。

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.2792
alternative hypothesis: true mu is less than 0
95 percent confidence interval:
-Inf 3.999998
sample estimates:
difference in location
-2.063745

> wilcox.test(Married, Single, exact=F, correct=F,
+ conf.int=T)

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.5584
alternative hypothesis: true mu is not equal to 0
95 percent confidence interval:
-8.999964 4.999991
sample estimates:
difference in location
-2.063745



82 :132人目の素数さん:2006/05/01(月) 01:52:33
> wilcox.test(Married, Single, alternative="greater", exact=F, correct=F,
+ conf.int=T)

Wilcoxon rank sum test

data: Married and Single
W = 56.5, p-value = 0.7208
alternative hypothesis: true mu is greater than 0
95 percent confidence interval:
-7.000074 Inf
sample estimates:
difference in location
-2.063745



83 :47です:2006/05/01(月) 02:13:54
>>79
どうもすみません。ありがとうございました。
参考にさせていただきます。

84 :132人目の素数さん:2006/05/02(火) 13:39:51
2つの推定量の漸近相対効率とは、
推定量の漸近分散の比なのでしょうか?
どう定義すればよいか教えて頂けませんでしょうか。

85 :132人目の素数さん:2006/05/02(火) 19:36:18
ちょっとスレ違いかもしれませんが・・・

元記事
http://www.asahi.com/politics/update/0502/002.html

「東京裁判の内容を知っているか知らないか」

「靖国神社がA級戦犯をまつっていることに抵抗を感じるか感じないか」

この2つの事象は、関係ありますか?それとも独立していますか?

数字はパーセンテージしか出てませんが、この数字で統計学的な
検証は可能ですか?

カイ2乗検定とかそういうのでできると思いますが、いかがですか?



86 :132人目の素数さん:2006/05/03(水) 01:55:45
>>85

できると思いますよ。
でも朝日かあ・・・・・こりゃまた適当な記事だよな。
ちょっとやってみるか。

87 :132人目の素数さん:2006/05/03(水) 02:10:24
?ん?でもコレヘンですね。
なんで

「東京裁判を知っている」「知らない」で
合わせて97%しかないんだろ?

88 :132人目の素数さん:2006/05/03(水) 02:48:07
ま、いっか。

取り合えずデータは多分こんな感じなのかな?


              |抵抗を感じる|抵抗を感じない|計
東京裁判を知っている|    348人|     454人|810人
東京裁判を知らない |    567人|    1407人|90人

東京裁判を知っている/知らないでの無回答はおよそ90人、で回答した中で抵抗を感じる/感じないでの
無回答は「知ってる」中で8人、「知らない」中で126人。
これら除外して、χ^2検定してみたら?

89 :132人目の素数さん:2006/05/03(水) 03:27:56
あ、ゴメン。

              |抵抗を感じる|抵抗を感じない|無回答|計
東京裁判を知っている|    348人|     454人|  8人|810人
東京裁判を知らない |    567人|    1407人|126人|2100人

だったね。

ちなみにフィッシャーの正確確率を使えば以下のようになりました。

H_0:東京裁判を知ってる事とA級戦犯が祀られている事に抵抗を感じる事には関係が無い。
H_1:東京裁判を知ってる事とA級戦犯が祀られている事に抵抗を感じる事には関係がある。

Fisher's Exact Test for Count Data

data: matrix(c(348, 567, 454, 1407), nc = 2)
p-value = 2.241e-13
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
1.597812 2.263102
sample estimates:
odds ratio
1.901668

よってやっぱり関係があるみたいです。

90 :132人目の素数さん:2006/05/03(水) 08:36:01
数量化T類(回帰分析)の質問です。
カテゴリカルデータだけを説明変数に
モデルを構築しても当然の事ながらマルチコは生じるのでしょうか?

91 :132人目の素数さん:2006/05/03(水) 23:57:23
ある釣り餌の有効性について知りたいのですがどのような考え方(統計方法)をすれば良いのかわからなくて困っています。
40人の釣り人が餌Xを使って順番に海、川、湖で釣りをしたところ釣れた魚の種類はそれぞれ24、12、10種類でした。
次に餌Xに私たちが開発した餌Yを混ぜて同じように釣りをしたところ、それぞれ26、14、14種類に増えていました。
知りたいのは「YはXより多くの種類の魚を釣る効果があったのか」
「YはXに比べて海川よりも湖でより多くの種類の魚を釣るのに有効であったのか」ということです。
Yは特に湖で淡水魚種を増やす目的で開発されたのです。各場所で釣れた魚の種類に重複はありません。
Xでは36種類、Yを混ぜたものではXに18種類の魚種が加えられて計54種類の魚を釣り上げました。
私の知りたい「効果があったのか」「有効であったのか」を解析する統計学的手法とはどのようなものが妥当なのでしょうか。
長くなりましたがどなたかヒントだけでもください。よろしくお願いします。

92 :132人目の素数さん:2006/05/04(木) 00:05:55
>>91

何で混ぜちゃったのw?

普通に考えれば二元配置分散分析かな?

93 :132人目の素数さん:2006/05/04(木) 00:16:50
>>92
ありがとうございます。混ぜてしまったのは混合用の餌だからです。
まったく別物の餌の場合と考え方がちがうのでしょうか?
「YはXに比べて海川よりも湖でより多くの種類の魚を釣るのに有効であったのか」
を考える場合も二元配置分散分析でよいのでしょうか。
文系出身の私ですが上司からのいきなりの命令で本当に困っています。


94 :132人目の素数さん:2006/05/04(木) 00:35:29
>>93

正直言いますと、実験終わってから解析方法考えるのってのはまずいんですよ。
データ取る前にどう言う分析がしたいのか、はっきり分かってなければならないんです。
本来その上司が「どう言う分析がしたいのか」分かってなければならないと思います。

普通に考えると、XとYを混ぜた時点で「YがXを強化する作用」、つまりいわゆる「交互作用」
がある、と仮定した方が妥当な感じを受けるのですが・・・・Yが独立で扱われてないので
それも難しそうですねえ・・・・・・・。

難問ですね。ちょっと考えさせてください。

95 :132人目の素数さん:2006/05/04(木) 01:16:36
>>94
本当に申し訳ありません。私自身もいろいろ調べているのですが。
餌X+Yを、まったく別物の餌として考えるのは間違っているのでしょうか?


96 :132人目の素数さん:2006/05/04(木) 02:02:34
二次関数 f(x)=(x-a)(x-b)  の頂点の座標は((a+b)/2,-(a-b)^2/4)で(平均値、-分散)

三次関数 f(x)=(x-a)(x-b)(x-c) の変曲点のx座標はa,b,cの平均値で 
極大極小のx座標は変曲点から標準偏差の1/√2倍だけ離れている。

n次関数 f(x)=(x-a_1)(x-a_2)(x-a_3)...(x-a_n) のnー1回微分がゼロの所は平均値 n-2回微分がゼロのところは、、、



97 :132人目の素数さん:2006/05/04(木) 08:15:04
ロジスティック回帰で、
1:良  10000サンプル
2:不良  100サンプル
のデータがあります。
このサンプルを全部モデル構築に投入して構わないのでしょうか?
それとも良データも不良データにそろえて100サンプルしか投入しない方がいいのでしょうか?
良データ10000サンプル投入した場合に懸念される結果などありますか?

98 :132人目の素数さん:2006/05/04(木) 13:09:09
>>95

それも可能だとは思います。
ところが>>93に拠ると、「より多くの種類の魚を釣るのに有効」ってのがネックなんですよ。
つまり、応答変数がカテゴリーなんですね。
単純に考えるとχ^2検定でも充分な気もしますが・・・・・・。
クロス集計してみました?

99 :132人目の素数さん:2006/05/04(木) 13:17:27
>>97

基本的には構わないと思いますよ。
ロジスティック回帰だと、線形判別関数の代わりに使われますが、
表現は「確率」で算出されるので、データ上不良品率100/10100になるのは
特に問題無いとは思います。
どちらかと言うと、説明変数の設計の如何でしょうね。

100 :132人目の素数さん:2006/05/04(木) 15:25:07
不良データを2000ぐらい集められるなら、
良データと不良データのサンプル数をそろえた方が良いと思います。

101 :132人目の素数さん:2006/05/04(木) 16:08:47
>>97

これ参考にしてみて。

http://www.fumotocpa.com/tousan3.htm

102 :132人目の素数さん:2006/05/04(木) 19:24:05
英文を訳していてわからない語があったのですが、
separate regressionとは日本語で言うと何のことですか?
統計関係の語であるということ、おそらくは〜回帰、という意味であることは分かったのですが、
それ以上が、ネットで検索しても分からず…。訳語だけ教えていただけたら、その内容については
自分で勉強します。よろしくお願いします。

103 :132人目の素数さん:2006/05/04(木) 23:34:40
>計量経済学者の故マダラ(Maddala)によれば通常のロジットモデルでは標本抽出比率が異なっていても説明変数の係数の推定に影響はないとしている。
>標本抽出比率が不均等であることは必ずしも分散不均性を引き起こすとは限らない。
>またプロビットモデルや線形確率モデルでも係数の推定には不均一な標本抽出比率によってあまり影響は受けないとも述べている。

>>101
ありがとうございます。
あまり影響を受けないとありますが、実務上は気にしなくて良い範囲なのでしょうか?

よく見るレポートでは>>100さんの言う通り、良不良のデータ数を揃えています。

104 :132人目の素数さん:2006/05/07(日) 00:17:56
統計学における
industrial experiment と external reference distribution とはどういう意味なんでしょうか?

105 :132人目の素数さん:2006/05/10(水) 19:50:47
統計学を本格的に勉強しなければならなくなりました。英語のテキストを勧められたのですが、
どれがいいのか教えてください。初級〜中級レベルです。

106 :132人目の素数さん:2006/05/11(木) 01:16:24
なぜ英語なのでしょうか?
その勧めた人が本自体は推薦してくれなかったのでしょうか?


107 :132人目の素数さん:2006/05/12(金) 18:39:41
標本共分散行列 S は、サンプル数を N とすると、 N で割る場合と N - 1 で割る場合がありますが、違いは何でしょうか??誰か教えてください

108 :132人目の素数さん:2006/05/13(土) 00:59:36
経済学部で授業で統計学をやっていて、
数学的にもっとちゃんとしたものが読みた
くなったのですが、なにかオススメはありませんでしょうか?

109 :132人目の素数さん:2006/05/13(土) 03:23:23
>>107
母集団から標本を取り出して分散を計算するとき
$n$で割って求めた分散は母集団の分散の不偏推定量になってない。
つまり平均を取ったときに母集団の分散にならない。
n-1で割ると不偏推定量。
標本データから母集団の情報を引き出すわけで
その引き出し方の良し悪しの指標がいくつかあって
その一つが不偏性。

ただでさえややこしいのに本によって前者も後者も
標本分散と呼ばれているからさらにわけ分からなくなる。

>>108
竹内啓 数理統計学
竹村彰道 現代数理統計学

110 :132人目の素数さん:2006/05/13(土) 21:02:59
>>109
その説明ではなんでnで割った方があるのかが分からない。
nで割った方は不要か?


111 :132人目の素数さん:2006/05/14(日) 13:06:56
>>110
nみたいなもので割らなきゃいけない。
そうじゃないと標本の数が大きくなればバルほど
ばらつき具合に関係なく分散が大きくなっちゃう。
2nでもn/2でもいいけどnがまあすなおだということ。

あとn-1よりnで割ったほうが発想としてはすなおだし
計算もきれいになる。


112 :132人目の素数さん:2006/05/14(日) 15:09:45
でもn-1でわるのは不自然な気がするけどそれはなぜ?

113 :132人目の素数さん:2006/05/14(日) 16:34:50
「分散」ってのは「平均からのバラつき」ですよね。
そうすると、あるデータがn個あって、その平均からのバラツキを問題にするワケなんですが、
問題は、「バラついたデータ」の個数は、「平均以外」なんですよ。
そうすると、「分散」が問題にしているのは、「平均以外のデータ」なんで、

分散が問題にしているデータの個数=データ数n−平均の個数

となります。平均の個数は1個ですよね?
だから、n−1で割るのです。

なんて説明じゃダメ?

114 :132人目の素数さん:2006/05/14(日) 18:28:23
分散ぐらいなら113の説明で理解できると思うけど、
自由度って本当に難しいですよね。

115 :132人目の素数さん:2006/05/14(日) 21:43:50
nで割る分散の話ですが、推測を必要としない全数調査の標本分散で
用います。


116 :107:2006/05/15(月) 11:17:06
皆さんありがとうございます。
なんとなーく理解できました

117 :132人目の素数さん:2006/05/17(水) 04:36:02
質問です。

二項分布で、N回コインをトスしてm回表が出る確率はB[N,m]p^m(1-p)^(N-m)というのは知っています。
では、表が出やすいコイン(p=p_H)と、出にくいコイン(p=p_L)を、それぞれN_H回、N_L回ずつトスして(トータルN_H+N_L回)、
合計でm回表が出る確率を表現する方法はありますか?

118 :132人目の素数さん:2006/05/17(水) 05:34:55
117ですが自己解決しました。スレ汚し申し訳ありませんでした。

119 :132人目の素数さん:2006/05/19(金) 16:38:47
いくつか教えてください。

初心者向けの例題が多数載っている統計実務の書籍がありましたら教えてください。
こういう場合にはこの分析法を使う、などの情報が大量に載っているものを探しています。

また、たぶん無いと思うのですがいろんなデータを入れとくだけで何らかの相関関係があるかを
さまざまな方法で分析してくれる統計ソフトがありましたら教えてください。

あと、よい統計のソフトがありましたら教えてください。
Rを使ってみたのですが、コマンドラインを覚えるのが大変で簡単な分析しかできていません。
GUIでできるものがあればいいのですが・・・

120 :132人目の素数さん:2006/05/19(金) 16:59:40
>>119

121 :132人目の素数さん:2006/05/19(金) 17:17:01
>>119

>初心者向けの例題が多数載っている統計実務の書籍

それに付いては分かりませんが、

>こういう場合にはこの分析法を使う、などの情報が大量に載っているもの

でしたら、

「入門多変量解析の実際」
http://www.amazon.co.jp/gp/product/4061539639/503-8783685-2432742?v=glance&n=465392

が良書だと思います。(もっとも“分析法”が“多変量解析”を示しているかどうか知りませんが。)

>何らかの相関関係があるかを
さまざまな方法で分析してくれる統計ソフト

相関関係を示すか否か、と言うのですと、ポピュラーなトコロでは連続量相手の相関係数かカテゴリー
変数相手のχ^2検定ぐらいしかないのでは無いでしょうか?
別な言葉で言えばMicrosoft Excel程度でも充分だとも言えます。



122 :132人目の素数さん:2006/05/19(金) 17:17:47
>GUIでできるものがあればいい

有料で構わなければ、有名どころでは

「JMP」
http://www.jmp.com/japan/corp/index.shtml

がコスト面では優れていると聞きます。
他にはMicrosoft Excelのアドインで、

「Excel多変量解析」「Excel統計」
http://www.esumi.co.jp/software/

また日本製の「JUSE」「StatWorks」
http://www.i-juse.co.jp/statistics/index.html

等があるようです。

123 :132人目の素数さん:2006/05/19(金) 21:35:35
>>121-122
ありがとうございます。
教えていただいたものをチェックしてみます。


124 :132人目の素数さん:2006/05/19(金) 23:06:59
>>119
統計・解析ソフトについて
http://pc8.2ch.net/test/read.cgi/bsoft/1012298063/l50




125 :haruta:2006/05/20(土) 16:18:31
アンケートをとって、結果を数値化して統計解析にて評価したい場合、
特に気をつけることなどありますでしょうか?

たとえば、回答項目は5つ以上が適当とか、こういう項目はあった
ほうがいいとかございましたらご教授くださいませ。

また、t検定以外に、アンケートの結果解析に適当な統計の手法など
もご存知でしたら教えてください。

126 :132人目の素数さん:2006/05/21(日) 09:11:51
すみません。SASの質問ですけれど、ここでさせていただきます。

SASで非線形多変量解析が出来るのはどのプロシジャでしょうか?
nlinは単変量しか扱えませんよね?

アドバイスよろしくお願いします。

127 :132人目の素数さん:2006/05/21(日) 15:25:18
すいません視聴率での話しなんですが

アル番組で男性が180人中36人視聴し 女性が150人に対して42人していた
これだけの情報でそれぞれの標準偏差ってわかるんでしょうか?

128 :132人目の素数さん:2006/05/21(日) 16:14:52
母平均の点推定ってマイナスになることもあるんですよね?

129 :132人目の素数さん:2006/05/21(日) 16:15:45

母平均の差の点推定です

130 :132人目の素数さん:2006/05/24(水) 18:32:04
すいません。どこに書けばいいのか分からないのでここに書きます。
統計学って数V数Cをとってないと学ぶ事は不可能なのでしょうか?

131 :132人目の素数さん:2006/05/24(水) 18:34:36
不可能ってことはない

132 :132人目の素数さん:2006/05/24(水) 22:29:13
本当ですか、ありがとうございます

133 :132人目の素数さん:2006/05/24(水) 23:07:15
>>130

なりますよ。

134 :134:2006/05/24(水) 23:53:18
どちらに質問させて頂けばよいのか分からないので、こちらに書かせて頂きます。

統計データが載っているサイトで、「負数又は減少したもの」を、
△で記述するサイトがあったり、▲で書いているサイトがあったりするのですが、
本当は△と▲は正しい使い分けがあるのでしょうか?

あと、▽と▼についても教えて頂けば幸いです。

135 :132人目の素数さん:2006/05/25(木) 00:48:44
>>130
国内に文科系学部は何百もあるが、入試で数IIIを必須にしてるところはたぶんゼロ。
でもそれなりの割合の学生は入学後に「統計学」を履修。

ひとくちに「統計学」といってもいろいろなんですよ。


136 :132人目の素数さん:2006/05/25(木) 01:03:55
>>135
同意。
ほとんど数式出て来ん講義もあるw


137 :132人目の素数さん:2006/05/25(木) 12:52:31
なんでもスレなので質問。

統計を取るのに良いアプリケーションはありませんか?
プログラミングなど出来ないので、GUIの充実しているものが良いです。

統計を取るのは株式市場の動き。
日付・曜日(時間)、動き(特定の記号)、値幅(数値)などから、
オリジナルの抽出&組み合わせで統計を出せれば良いです。
グラフ描けるとなお良いです<折れ線グラフで十分

現在Excelで行っていますが2万レコード程度のものもあり、動作が重くなってきました。
これからもデータは取り続けるので、この際に何か良いものは無いか探しています。
<SQLを勉強すればよいのかもしれませんが

何か良いものがありましたら、お知らせいただければ幸いです。

138 :132人目の素数さん:2006/05/25(木) 15:35:39
くだらない質問ですみませんが

累積相対度数と相対累積度数

レポート書かなければならないんだが
調べると2つ言葉があってどちらが正しいのかわかりません
どちらも同じ意味でOK?

139 :132人目の素数さん:2006/05/25(木) 15:40:09
>>138

正確には多分「累積相対度数」なんだろうけど、相対累積度数とも言うみたいですね。
正直、統計学は数学ではないので、用語はかなりグチャグチャですwww

140 :132人目の素数さん:2006/05/25(木) 15:43:09
>>139
ありがとうございます
累積相対度数の方を使わせていただきます

141 :132人目の素数さん:2006/05/25(木) 18:03:24
牛の数を推測してください

142 :132人目の素数さん:2006/05/25(木) 19:28:46
>>141

2

143 :132人目の素数さん:2006/05/25(木) 23:36:10
>>135>>136
そうなんですか、ありがとうございます。
エンジニアになるための統計学なので、
もし辛くても頑張ります(?)

144 :132人目の素数さん:2006/05/26(金) 00:22:11
>>143
ビジネス書のコーナーにも統計学あるでしょ。
それで様子がおかしかったらご相談ということで

145 :132人目の素数さん:2006/05/26(金) 10:00:15
>>143
うみゅー、エンジニア目指すのに数III取ってないとは…。


146 :137:2006/05/26(金) 14:36:09
適当なのはありませんか

147 :132人目の素数さん:2006/05/26(金) 17:26:16
>>146
>>119-124
でも実際にGUIって少し手の込んだことしようとすると
ムチャクチャ面倒になることも多い。
何人もの人間で使うならともかく、Rみたいなのは
敷居は高いけど後から楽だったりもする。

148 :132人目の素数さん:2006/05/26(金) 18:55:44
>>137

株式市場となるとちょっと分かりませんね。
中央大学のサイト

http://www.asahi-net.or.jp/~ap8h-ykkr/

には色々な経済学系のエクセルマクロが置いてあるので、ここからダウンロードして取りあえず使い勝手を見てみればイイんではないでしょうか?

>>147

確かにRはラクなんだけど、2万ものデータとなると・・・・・・。
結構R自体が大規模データを扱い辛い、と言った印象があります。

149 :132人目の素数さん:2006/05/27(土) 07:17:01
20%の確率でA
30%の確率でB
50%の確率でC

になるカテゴリー分布があります。

この割合でABCを発生させる、分布もしくはロジックが存在しないでしょうか?

150 :132人目の素数さん:2006/05/27(土) 09:57:46
>>149
多項分布でしょ。

151 :132人目の素数さん:2006/05/27(土) 14:39:08
>>143>>143
回答ありがとうございます。訳あって海外で学ぶ事になるのですが、
数学を履修してない場合、そこで数学を学べるみたいです。
回答して下さった方々本当にありがとうございました。

152 :132人目の素数さん:2006/05/27(土) 18:12:54
正準相関分析とは実務でどのように活用していけばいいのでしょうか?


153 :132人目の素数さん:2006/05/28(日) 05:25:42
http://www.jfpa.or.jp/01-topics/051104.html
このホームページに書かれている「性交経験累積率」とは何なのかよく分かり
ません。

性交経験者率(2005年の調査方法)については下記のように説明されているので
よく理解できますが、性交経験累積率とは果たして何なのか?全く説明されてないので
理解できません。

>そこで従来実施してきた高校生の性交経験累積率に変えて、各学年毎に性交経験の有
>無を問い、調査人員(無答数を除く)から「性交経験無し」の回答数を差引いた数を
>「性交経験あり」とした。
> これを02年の調査結果と比較すると、高1〜高2は顕著に減少しているが、高3は僅かな減少である。

性交経験者率と性交経験累積率の違いについてわかりやすく教えてください。




154 :132人目の素数さん:2006/05/28(日) 08:45:59
>>153

性交経験者率を0回からn回まで積分したんじゃねえのwww?

155 :やす:2006/05/28(日) 18:06:55
みなさん助けてください><
統計の問題がわからないのですが教えてくれませんか??


156 :132人目の素数さん:2006/05/28(日) 18:09:21
>>155
服脱げ

157 :GiantLeaves ◆6fN.Sojv5w :2006/05/28(日) 18:53:53
talk:>>155-156 服ぬいで何をするつもりだ?

158 :132人目の素数さん:2006/05/30(火) 07:06:04
>>155
そんなこと書いてないでさっさと質問すればいいのにw


159 :132人目の素数さん:2006/05/30(火) 11:56:54
教えて下さい。
格差を表すジニ係数を出す時に、
例えば使用率のような数字を使ってもおかしくないでしょうか?
個人的には、使用率の分子にくる使用額を使ってジニ係数を算出する方がいいと思うのですが。
詳しい人教えて下さい。

160 :132人目の素数さん:2006/05/30(火) 13:32:58
統計素人です.おしえてください.
2次元でデータを散布した場合,ある集団とある集団のデータで分布に
違いがあるように見えるのですが,これを統計学的に検定する方法は
ありますか.

161 :132人目の素数さん:2006/06/02(金) 20:48:21
>>160
誰も反応しませんが、説明して分かるのかなあと思っているからでしょう。
たとえば、

http://aoki2.si.gunma-u.ac.jp/R/wilks.html

などが考えられますが、素人にはちんぷんかんぷんかも。


162 :132人目の素数さん:2006/06/08(木) 03:04:39
統計をとるための調査において、回答数は多くても
回収率の低い調査はなぜ注意が必要なのか理由を述べよ。

↑問題文の意味も良くわからないのですが
これについて何かわかる人いますか?

163 :132人目の素数さん:2006/06/08(木) 04:05:25
そういう訊き方じゃ「います」で終了だよ。
http://www.k3.dion.ne.jp/~mabuchi/lectures_nara/sample_and_archives.htm

164 :132人目の素数さん:2006/06/08(木) 08:37:31
>>162
十万も回答が集まったけど
実は一千万も回答を依頼してましたってな場合、
1%しか回答くれてないことになるよね。

政党支持率調査を例に考えてみては?


165 :132人目の素数さん:2006/06/08(木) 09:24:18
熱狂的な信者のみが回答したってことか。

166 :132人目の素数さん:2006/06/08(木) 09:38:57
162です。
>>163
>>164
どうもありがとうございます!

167 :132人目の素数さん:2006/06/08(木) 10:33:24
質問させてください

一日にかかってくる電話の件数Xは平均1.6のポアソン分布に従い、e^-1.6≒0.202 とする
(1)一日に一件も電話がかかってこない確率→(1-1.6/100)であってますか?


800人の学生がけがをするのは1年(365日)に100人の割合であり、e^-0.2740≒0.7603 とする
(1)一日に一人だけけがをする確率は?



168 :132人目の素数さん:2006/06/08(木) 10:58:18
(1)e^(-1.6)=0.202
(2)λ=100/365 , p=λe^(-λ)=0.208

169 :132人目の素数さん:2006/06/08(木) 14:22:32
p-pプロットとq-qプロットの説明が色々あって困ります。
ppの方は分布関数を比べるだけで、
qqの方はppプロットの散布図のようなものなんでしょうか。
どこかのサイトにデータを小さい順に並べればいい、
と書いてあったので混乱しています。

170 :132人目の素数さん:2006/06/08(木) 21:39:09
>>162
むかしハイトリポートというエロ本があった。
是非調べて欲しい。

171 :132人目の素数さん:2006/06/09(金) 00:12:56
ゼイキン報告とかね

172 :132人目の素数さん:2006/06/09(金) 01:44:34
キンゼイ報告とかね

173 :132人目の素数さん:2006/06/09(金) 01:54:12
キンゼイの方は調査の方にけっこう気を配っててそれなりに信頼できるという意見と
知り合い関係で調査対象集めたからダメという意見と両方あったような気がする。

174 :132人目の素数さん:2006/06/09(金) 22:42:50
(祝)赤石弘次氏 京都賞受賞

175 :132人目の素数さん:2006/06/10(土) 00:51:25
>>174
赤池だろwww

176 :132人目の素数さん:2006/06/10(土) 07:02:38
>>162
北朝鮮やかつてのイラクの政府支持率調査

こわー

--
アメリカのBSE検査

やばそうなのは避けて絶対健康そうなのを選択してる予感
こわー


177 :132人目の素数さん:2006/06/10(土) 12:59:38
>>176
新聞の特殊指定廃止アンケートを新聞社がやると9割くらい反対になるそうだ。
公取委に寄せられる意見も9割超が反対とか。

誰かが北朝鮮か全人代選挙みたいといってた。
どう見ても組織的に結果を出しているようにしか見えない。

178 :132人目の素数さん:2006/06/10(土) 13:16:55
数学嫌いの学生です。統計学について質問させてください。
最近4つの問題を考えるにあたって統計学について疑問に思っています。
1,BSE検査について。
 十分な部分的な牛のデータ(BSEに感染してるか)を取ることによって、
 全体の牛がBSEに感染しているかどうか判定できる。
 十分な数のデータは、全体のデータと科学的価値は同じであり、どちらからも感染牛がいないか真偽を判定できる。
2,宗教について。
 統計学的に十分な数の病人を通常の治療に加え、本人に気づかれないように神に祈りをした群としなかった郡に分け、
 治る速度を計測したところ、祈りをした郡は治りが早かったため、祈りは治療に役に立つと判定できる。
3,証券分析について。
 今までの特定の証券の人気(株価)の動き方のデータを十分に取ることによって、
 経験的にその証券の動きを予測することができる。
4,占いについて。
 経験的に統計をとった科学的なものである。
 手相占いにしても、生命線が長い人が長生きするのは十分な統計を取った上で、
 その関連性を認められた科学的なものである。

最近以上の4つの問題から統計学を科学的だとする主張を聞きました。
しかし僕個人としては感覚的に納得できません。
なぜ自分でも感覚的に納得できないのかが分からないのですが、
このもやもやを解決する意見をくれる方がいましたらお願いします。

179 :132人目の素数さん:2006/06/10(土) 13:25:12
>>178
1、母集団の中から本当にランダムに標本を採っていれば確率モデルを仮定して
母集団の中のBSEの割合がある一定値以下であることを5%とか1%の間違いは
許容して調べることができる。

2はダブルブラインドについて調べるといい。

3は株を買ってる人たちの集団が何も学習せず、ずっと同じパターンに
同じ反応を示すなら正しい。

4.占いができた頃の統計(というか集計というか経験を集めたもの)はかなり怪しい。

180 :132人目の素数さん:2006/06/10(土) 15:24:20
> 最近以上の4つの問題から統計学を科学的だとする主張を聞きました。

示された4つの事例を根拠として統計学を科学的だと主張することはできない。
これは、統計学の問題ではなくて論理学の問題。

逆に、統計学を使ったから科学的だという1−4の主張に対して
疑問を持っているのなら、>>179

統計学を間違って使えば非科学的な主張でも証明できる(証明できたように見える)
場合があるので、統計学を使った説明が常に科学的だということにはならない。

181 :132人目の素数さん:2006/06/10(土) 17:31:55
いくら数学嫌いでも>>180ぐらいは言われなくてもわからんとヤバイぞ

182 :132人目の素数さん:2006/06/10(土) 18:07:19
>>179
なるほど、牛の問題では、統計学を用いて感染牛がいないことが科学的に証明できるわけではなく、
誤差を許容して確率が分かるということですね。
ダブルブラインドについては調べてみます。
後はデータが正確に取れているか疑わしいものと、統計を利用して真偽を判定するためには前提があるというものですか。
どうもありがとうございます。
だいぶもやもやが取れました。

>>180
すみません、統計学を科学的だとする主張でなく、統計学を用いて科学的に正しいとする主張でした。
その通りだと思います。
統計学を使ってモヤモヤの残る主張を科学的だとする人はかなり多いと思います。
今日もサッカーの強さと酢の使用量を関連付けて科学的に酢を消費するとサッカーが強くなることが証明されたと
主張している企業のニュースを見ました。

>>181
精進します。自分でも学びたいのですが・・

183 :132人目の素数さん:2006/06/11(日) 16:50:41
>>178
 参考まで。
2について:Russell Stannard, 1999, The God Experiment
 著者へのインタビューが『哲学者は何を考えているのか』(春秋社)にある。

4について:1985のNature誌に占星術についての統計的研究が載ってるらしい。
 『確率と統計で世界を読む』(白揚社)47頁以降参照。ただし,結果は
 「統計的に優位な差は認められなかった」。

184 :183:2006/06/11(日) 16:52:42
あー訂正。「有意な差」です。

185 :132人目の素数さん:2006/06/11(日) 21:01:19
ブートストラップ法とは要するに重複を許したサンプルを抽出する事により
母集団の平均やらを求める手法ですか?いまいちよく解りません。教えてください。

186 :性交経験率調査についての実態:2006/06/12(月) 11:40:17
「高校3年生の経験率が45%だと主張する都性研の統計」
学校の先生に調査を依頼する、経験ないと答えた者以外全員「経験あり」と判断する、など
調査方法がめちゃくちゃであり、信用に足らない。高1と高2の経験率が理由も無く、
いきなり大幅に減ったりするなど、あまりにもお粗末な調査。
参考URL http://www.jfpa.or.jp/01-topics/051104.html

「高校生の経験率25%、大学生の経験率50%〜60%と主張する性教育協会の統計」
高校生の調査については、調査員を派遣するなどしており、調査方法に不備は無い。
しかし大学生の調査方法が、女子の調査だけ短大と4年生の大学を混ぜるなど、
調査方法として若干の不備があり、調査する人間も調査員ではなく学校の先生であり、
顔見知りが調査するという不備がある。
参考URL http://www.jase.or.jp/jigyo/youth.html

「20代前半(22歳前後)の経験率が6割だと主張する国立社会保障・人口問題研究所の統計」
顔見知りが調査する事も無く、他の調査方法にも大きな不備は見当たらない。
ただし、調査票の回収率が85%(無効票を除外すると75%)であり、回答に答えなかった
人に偏りが無かったかどうかには若干の疑問が残る。
(経験率については、結婚率と未婚の人間の経験率を合わせて考えたものです)
参考URL http://www.ipss.go.jp/ps-doukou/j/doukou12_s/doukou12_s.htmL

「まとめ」
これらの統計からある程度信用できる調査だけを抜き取り考えると、
男女ともに16,7歳で25%前後〜20代前半で60%位が、平均であると考えられ、
20代前半までに経験したなら、それほど遅くも無いという事になる。
しかし、20代も後半に入ると、男女ともに20%を切り、公言しない人間が増える等もあり、
世間ではかなり肩身の狭い思いをするであろうと予測される。

187 :132人目の素数さん:2006/06/12(月) 13:01:28
数学には全然素人です。
統計力学と量子力学における確率の違いについて教えて下さい

188 :132人目の素数さん:2006/06/12(月) 14:02:47
確率は確率。同じ。

189 :132人目の素数さん:2006/06/12(月) 14:05:40
>>187
oとxが対等なのに
ooとxxとoxが1/3ずつになるってやつのこと?

190 :132人目の素数さん:2006/06/12(月) 15:11:23
>>189
哲学板で議論されてるもののコピペです
>量子力学に関してパラドックスと呼ばれているものの大部分は確率の解釈に関する
問題です。 人が日常生活において「確率」を考えるとき、そこにはどのような予測、
信念、繰り返し に関する経験則が想定されているのか?という問題です。
確率を、繰り返し事象やアンサンブルに関する頻度を与えると解釈する
分には、何も 問題は感じないでしょう。しかし、個別の事象に確率概念は
適用できるのか?という哲学的問いがあります。個別事象に関して確率を
考えることはできないと切って捨てることは簡単だし、実際 統計力学の
場合そのような解釈は可能でしょう。難しいのは、量子力学の場合波動関数
は個別の事象に関する何かの客観的属性を表しているのか、それとも繰り
返し事象やアンサンブルに関する属性を与える物にすぎないと考えるべき
なのか、という問題です。私は、波動関数は個別の事象に関する何かの
客観的属性を表しているという考え方を捨ててもよいと思いますが、
それが捨てられないのは、波動方程式が一切の統計的仮定を含まず、
あたかも個別粒子の方程式の拡張のごとく導かれているからだと思います。
これが捨てられない人は、波束の収縮などの問題がパラドックスだと
思えるのでしょう

191 :132人目の素数さん:2006/06/12(月) 15:14:19
>>189
190の続きです

>統計力学の場合は、我々が知らないだけで個々の事象の状態は決まっている。
量子力学の場合、個々の事象の状態について我々は確定的言及はできない。
そんな感じでしょうか。
両者の違いは、
統計力学:状態空間の大きさ=観測空間の大きさ
量子力学:状態空間の大きさ>観測空間の大きさ
ということに起因していますが、これじゃわからないでしょうね。

---コピペここまで---
以上の議論が何を示しているのか、私には分からないので、
統計力学と量子力学における確率の違いについて教えてほしいのです。

192 :132人目の素数さん:2006/06/12(月) 16:23:12
>>190,191
物理板の方がよいと思う。

■ちょっとした疑問や質問はここに書いてね61■
http://science4.2ch.net/test/read.cgi/sci/1149505456/

193 :132人目の素数さん:2006/06/12(月) 16:34:20
>>190
確率の違い、ではなく「確率をどう解釈するか」の違い。

で、実は

> 難しいのは、量子力学の場合波動関数
> は個別の事象に関する何かの客観的属性を表しているのか、それとも繰り
> 返し事象やアンサンブルに関する属性を与える物にすぎないと考えるべき
> なのか、という問題です。

こっちの方が肝心なのね。2chだけに頼るのはお勧めできないけど物理板へどうぞ。

194 :190:2006/06/12(月) 19:25:43
>>192-193
ありがとうございます。物理板に聞いてみます。

195 :132人目の素数さん:2006/06/15(木) 11:09:50
質問させてください。
ここで質問させていただくのが適切かどうかは微妙なのですが、
パラメータの推測に用いる数値計算アルゴリズムで、
Newton-Raphson法が使える(ヘシアンが求まる)状況で、
準ニュートン法を用いるメリットはありますか?
というのも、準ニュートン法でプログラムを組むほうが
簡単かなと思ったもんで・・・

196 :132人目の素数さん:2006/06/15(木) 16:22:10
集団の要素がそれぞれ等しく分散しているかどうかっていうのを求めたいんですが
どうしたらいでしょうか。

[1, 2, 3, 4 ] は [1, 1, 4, 4] という集合より等しく分散している
というのを求めたいのです。

なんと言えばいいのか分からないのですが、自分の知っている単語で近いのは、
エントロピーです。

すみません、馬鹿な質問だとは分かってるんですが、どなたかヒント頂けないでしょうか

197 :132人目の素数さん:2006/06/15(木) 18:01:17
母分布が(0,1)の一様分布で、
観測個数3個

以上の場合の、
@中央値の分布関数
A密度関数
B中央値の期待値
C最大値と最小値の密度関数

を教えて。

198 :132人目の素数さん:2006/06/16(金) 16:58:39
離散型確率変数X,Yについて、
Var[aX+bY]を、Var[X],Var[Y],Cov[X,Y]を用いて表しなさい。
ただし、Varは分散、Covは共分散、a・bは定数とする。

解き方を教えてたもれm(__)m

199 :132人目の素数さん:2006/06/17(土) 00:38:03
>>198
Var[aX+bY] = E[(aX+bY)^2] - (E[aX+bY])^2
= E[a^2X^2+2abXY+b^2Y^2] - (aE[X]+bE[Y])^2
= a^2{E[X^2]-(E[X])^2} + b^2{E[Y^2]-(E[Y])^2} + 2ab(E[XY]-E[X]E[Y])
= a^2Var[X] + b^2Var[Y] + 2abCov[X,Y]

200 :統計まなびたい:2006/06/17(土) 16:59:17
こんにちは、統計ソフトについての質問があります
どなたか初心者の視点で教えていただければよいのですが。
いま、修論の社会調査をするにあたって、Excelでどの程度分析が可能なのか知りたいのです
サンプル数は50くらいで、複数回答の質問紙調査です。学校の先生が忙しくてぜんぜん聞ける状態でなくTAもいなくて、相談できずにいます。

201 :132人目の素数さん:2006/06/17(土) 19:56:42
>>200

>Excelでどの程度分析が可能なのか知りたいのです

この質問は本末転倒でしょう。
先に「どう言った分析がしたいのか?」が先に来るべきであって、
Excelはツールに過ぎません。
最初に「分析」が来て、後で「どう言うツールが使えるか?」が来るのです。

一応挙げておきますが、

・回帰分析(数量化I類、二群の判別分析、数量化II類、ただし独立変数は16変数まで)
・分散分析(ただし二元配置はかなり限界がある)

辺りくらいまでは分析可能です。
それ以上だと、統計アドインツールやソルバーの力を借りないと難しいでしょう。

202 :197:2006/06/18(日) 17:42:02
>>197です。

母分布が(0,1)の一様分布で、
観測個数3個
母集団における分布関数はF(x)

以上の場合の、
@中央値の分布関数
A密度関数
B中央値の期待値
C最大値と最小値の密度関数

を教えてください。
という質問に対して、

F(x)=x
最小値、中央値、最大値をそれぞれ X1 , X2 , X3 とする。
@F2(x) = P(X2≦x) = P(X2≦x≦X3) + P(X3≦x) = 3x^2(1-x) + x^3 = 3x^2-2x^3
Af2(x) = F2(x)' = 6x(1-x)
BE(X2) = ∫[0,1] 6x^2(1-x)dx = 1/2
Cf3(x) = 3x^2 , f1(x) = 3(1-x)^2

という回答をいただきましたが、
@をこの答にすると微分してもxが残ってしまいます。
一様分布の密度関数は定数になりますよね?
0〜1区間横軸に水平なんで。

どなたかこの答えを検証していただけないでしょうか。

203 :132人目の素数さん:2006/06/18(日) 18:48:06
>>202
中央値は最小値・最大値に依存するんで、1/2周辺になる確率が、0や1周辺になる確率より、大きくなるのが自然かと…。

204 :132人目の素数さん:2006/06/19(月) 12:18:44
大阪府立大学で統計学の助手の公募だよ。

http://jrecin.jst.go.jp/html/kyujin/main/D106060108.html

205 :132人目の素数さん:2006/06/19(月) 15:11:46
ある大学での過去5年間の男子新入生の体重の平均は154ポンドで、
標準偏差平均が20ぽんどである。
今年の新入生登録名簿の中から選んだ100人の学生の体重の平均が
159ポンドであったとすれば、今年の新入生の体重は
例年の新入生の体重より重いといってよいか、理由付けして答えろ


だれか、お願いします。。。

206 :132人目の素数さん:2006/06/19(月) 15:49:57
>>205
平均も標準偏差もわかっているから、検定統計量は

√n(X-X0)/σ〜N(0,1)
を使えばいいから、
計算すると、
√100(158−154)/20
=2

あとは、2が標準正規分布の上側何%点になるのかを表を使ってチェックすれば?
今、手元に表がないからオレは知らないが。



207 :206:2006/06/19(月) 15:52:45
すまぬ。
X0は159だから、検定統計量は2.5だ

208 :206:2006/06/19(月) 16:03:51
あ〜X0じゃなくて、Xが159だよ orz
すまぬ。

209 :132人目の素数さん:2006/06/20(火) 03:28:04
実験者はu=u0とういうことを述べるヌル仮説を試みる両側検定を用いた。
The population is normally distributed and
その分散はわからない。5人の無作為抽出の観察対象が用いられその
標本の結果はx~=-2.611でした。
この結果についてどう結論づけることができるか。

a The result is significant at the 0.1-level and is not significant at the 0.05 level

b The result is significant at the 0.05 level and is not significant at the 0.02 level

c The result is significant at the 0.02 level and is not significant at the 0.01 level

d The result is not significant because its direction si contrary to that of H1

誰か頼む。宿題で明日提出で非常に困ってる。答え教えてください。
日本語の中に英語がまじってるのは訳がどうしたらいいかわからない。

210 :132人目の素数さん:2006/06/20(火) 03:38:36
全部英語で書いてくれ

211 :132人目の素数さん:2006/06/20(火) 03:47:27
An experimenter used a two-tailed test to test a null hypothesis stating that u=u0
The population is normally distributed, and its variance is unknown. A random sample
of 5 observations was employed,and the sample's result was t(x~)=-2.611.
What can we conclude about this result?


a The result is significant at the 0.1-level and is not significant at the 0.05 level

b The result is significant at the 0.05 level and is not significant at the 0.02 level

c The result is significant at the 0.02 level and is not significant at the 0.01 level

d The result is not significant because its direction si contrary to that of H1

です。よろしくお願いします。


212 :132人目の素数さん:2006/06/20(火) 07:11:39
>>211
答えはaだな。

213 :132人目の素数さん:2006/06/20(火) 08:08:07
>212
どうもありがとう!これから学校に行ってきます。

214 :132人目の素数さん:2006/06/20(火) 11:02:47
>>209

>The population is normally distributed and

@populationは確かに人口だが、統計では「母集団」と訳す。
Anormally distributed=正規分布

>The result is significant

significant:統計学では「有意」と訳す。「結果は有意である」

215 :132人目の素数さん:2006/06/20(火) 11:21:53
>>214
訳より答えが知りたかった訳で既に>213が答えてるわけだが

216 :132人目の素数さん:2006/06/20(火) 14:34:13
>>215

中途半端な訳を載せる

217 :132人目の素数さん:2006/06/20(火) 19:46:50
偏差値の差ってどうやったら検定できるんですか?
t検定は無理でしょ?

218 :132人目の素数さん:2006/06/20(火) 20:59:43
>>217
きみの質問むずいな

219 :132人目の素数さん:2006/06/20(火) 23:33:52
>>217

分散の差の検定すれば?

220 :132人目の素数さん:2006/06/20(火) 23:52:21
>>219
平均の差の検定と比率差の検定しか知りません

221 :132人目の素数さん:2006/06/21(水) 04:20:13
>>217
引き算でいいんじゃね

222 :132人目の素数さん:2006/06/21(水) 07:58:17
すいません基礎から学ぶのに王道の教科書教えてください

223 :132人目の素数さん:2006/06/21(水) 08:14:11
統計学入門

224 :132人目の素数さん:2006/06/21(水) 10:14:30
>>220

http://aoki2.si.gunma-u.ac.jp/lecture/Average/bunsan1.html

225 :205:2006/06/21(水) 14:51:35
ありがとうございます
理由付けの仕方がわからないのですが・・・

226 :132人目の素数さん:2006/06/21(水) 15:39:06
>>225
君は>209と同一人物ではないかい?


227 :132人目の素数さん:2006/06/21(水) 18:42:00
>>225
表で確認すると、2.5は上側0.6%点
だから、大きいと判断してよい。
片側検定で1%棄却域でも棄却されるわけだし

228 :132人目の素数さん:2006/06/21(水) 18:43:28




229 :132人目の素数さん:2006/06/21(水) 22:43:07
AICについて質問です。

AICは
-2 × 対数尤度 + 2 × 自由度
で算出できますよね?

AICがマイナスになる事はあり得ないと思って間違いないでしょうか?

230 :132人目の素数さん:2006/06/21(水) 23:15:36
229です。
説明不足でした。

尤度は0〜1の値をとるので、対数尤度は0より必ず小さくなる。
よって、-2 × 対数尤度は0以上

2 × 自由度も当然0より大きいので、AICがマイナスになる事がありえないと考えています。


231 :132人目の素数さん:2006/06/25(日) 11:33:46
>>229, 230
連続型分布の場合、尤度は確率密度に対応するので0〜1と
限らないのでは?そうすると負にもなりうるけど。


232 :132人目の素数さん:2006/06/25(日) 16:21:39
尤度って確率ですよね?
0〜1以外のケースってどんな時でしょうか?

233 :231:2006/06/26(月) 19:48:54
書いたとおり、連続型分布の場合、確率は区間でしか生じないので
確率密度を使うはずです。密度は1という上限はありません。
正規分布の尤度関数を考えてみるとよいでしょう。


234 :132人目の素数さん:2006/06/26(月) 23:39:22
例えば正規分布の確率密度関数の値域が1を超える事があるということでしょうか?
尤度関数は確率を掛け合わせたものだと思っています。
これが1を超えるのが想像できません。
おばかな私にもわかるようにご教授ください。お願いします。

235 :132人目の素数さん:2006/06/27(火) 03:13:31
A machine is set to produce metal shims having a thickness of .05 inches.
To maintain the proper setting, 10 shims are tested each day. If the computed T-value
value falls between -t0.025 and t0.025, the macainist is satisfied that themachine is in adjustment.
What shoud he conclude about the setting on the basis of a sample that has a mean of 0.053 inches and a standard
deviation of 0.003 ?

t=0.053-0.05/(0.003/√10)から-0.025<t<0.025か判断して
なにかを結論づければいいの?
だれか教えて〜

236 :235:2006/06/27(火) 11:27:33
一応自分でだした答えが
標準誤差=0.003/√10≒0.0009
自由後 9のt分布を使えばいいの?

あと
A reading test is given to an element school class that consists of 12 Anglo-American
children: mean=74,standard deviation=8:Mexican -American children:mean=70,standard deviation=10.Is the difference
between the means of the two groups significant at the 0.05 level of significance?
読解のテストが12人のアングロアメリカンの子供と10人のメキシコ系アメリカ人の子供からなる
小学校のクラスに与えられた。テストの結果は(1)アングロアメリカ人の子供;平均 74 標準偏差 8
メキシコ系アメリカ人の子供;平均70 標準偏差 10 二つのグループかの平均との間に0.05の有意水準において
有意であるか?

だれかおせーてください。お願いします。('A`)


237 :235:2006/06/27(火) 12:09:44
t分布を使おうとしても有意水準がわかんないっす'A`)

238 :132人目の素数さん:2006/06/27(火) 20:00:59
あのすいません、2群の差の検定なんですが、
国家群Aの失業率が6%、7%、8%、国家Bの失業率が3%
とあったときに両者に統計的にみて有意な差があるか確かめたいです。
この場合、
Aの標本平均7(=(6+7+8)/3)%、Bの標本平均3%であり、

Aの普遍分散 2/3 =((6-7)^2+(7-7)^2+(8-7)^2)/3
Aの普遍分散 0=((3-3)^2)/1

両群をあわせた分散の推定値
=〔(3−1)*2/3+(1−1)*0/1〕/(3+1-2)=2/3

検定等計量=|7ー3|/√{(2/3)*[(1/3)+(1/1)]}=4/√{2/3*4/3}=6/√2

というように検定していいんでしょうか。

239 :231:2006/06/27(火) 23:38:27
>>234
正規分布の密度関数は具体的に分かってますか?
そうであるなら分散σ^2が非常に小さいと値が1を超える
ことが簡単な計算で分かると思いますが。
密度関数は曲線下の面積は1ですが、とがっていれば
高さは1を超えます。

240 :132人目の素数さん:2006/06/28(水) 05:13:53
>>238
分散分析から、事後検定です

241 :132人目の素数さん:2006/06/28(水) 07:06:35
統計学の授業で教授がじいさんでさっぱり理解しにくいです。

正味が100グラムと表示されている麺を、9個ランダムに取り出して、その重さを量った。
9個の麺の重さは、互いに独立で同一の正規分布に従うものとする。
9個の麺の重さはの標本平均は98グラムしかなかった。
メーカーに問い合わせたところ、母集団標準偏差は2・25であるという回答を得た。

(1)このとき最も適切な帰無仮説と対立仮説をは何か?

(2)有意水準を5%として検定せよ。必要ならばt(0.1、∞)=1.645 、t(0.05、∞)=1.960を用いよ。
このとき(1)では、
帰無仮説 Ho : μ0=98 対立仮説 H1:μ1>98でイイのでしょうか??

全く解らなくて…

(2)では、μ0+t(α+∞)√σ^2/n を使えばよいのでしょうか?つまり、98+1.960×2.25ってことでしょうか??

誰か問題を理解できる方、解説お願いします。

242 :132人目の素数さん:2006/06/28(水) 08:04:27
>>241
1)
H0: u=100
H1: u=/ 100 <- not equal to

2) t8 = (100-98) / (2.25/√9) = 2.67
since t8=2.67 > t*=1.96, reject H0


243 :132人目の素数さん:2006/06/28(水) 10:20:41
どなたか、プロペンシティスコアについて初歩的なことから教えていただけませんか?

244 :132人目の素数さん:2006/06/28(水) 12:31:32
>>240
ありがとうございます。分散分析は勉強したことないんですが、
せっかくなんで勉強してみます。

245 :132人目の素数さん:2006/06/28(水) 14:02:12
>>242
ありがとうございます!!
ちなみに次の問題ならばどうなりますか?ずうずうしくて申し訳ございません。
ほんとに助けてください。

正味が200グラムと表示されている缶詰を、10こランダムに取り出して、その重さを
量った。
10個の缶詰の重さは、互いに独立で同一の正規分布に従うものとする。
10個の缶詰の重さの平均は197グラムであり、標本標準偏差は5.25であった。
(1)このとき最も適切な帰無仮説と対立仮説をは何か?

(2)有意水準を5%として検定せよ。必要ならばt(0.1、9)=1.833
t(0.1、10)=1.812 、t(0.05、9)=2.262、t(0.1、10)=2.228
を用いよ。

ホントにお願いします。



246 :132人目の素数さん:2006/06/28(水) 16:23:03
>>245
1)
H0: u=200
H1: u=/ 200

2) t9 = (200-197) / (5.25/√10) = 1.81

since t9=1.81 < t(9,α=.05)*=2.26, not reject H0



247 :132人目の素数さん:2006/06/28(水) 19:01:14
>>242
ありがとうございます!!
ちなみに次の問題ならばどうなりますか?ずうずうしくて申し訳ございません。
ほんとに助けてください。

正味が200グラムと表示されている缶詰を、10こランダムに取り出して、その重さを
量った。
10個の缶詰の重さは、互いに独立で同一の正規分布に従うものとする。
10個の缶詰の重さの平均は197グラムであり、標本標準偏差は5.25であった。
(1)このとき最も適切な帰無仮説と対立仮説をは何か?

(2)有意水準を5%として検定せよ。必要ならばt(0.1、9)=1.833
t(0.1、10)=1.812 、t(0.05、9)=2.262、t(0.1、10)=2.228
を用いよ。

ホントにお願いします。



248 :132人目の素数さん:2006/06/28(水) 19:03:39
>>247
see >>246

249 :132人目の素数さん:2006/06/28(水) 19:24:17
>>248
ありがとうございます!!!!!!!
感謝感激です!てか、問題2個のせて申し訳ないです。

最後にお願いできますか?

各人の右足は左足よりも長いという傾向があるか検定したい。
100人の右足の長さと左足の長さを測定した。
その結果以下のことがわかった。
                標本平均  標本分散
右足の長さ            25.8cm   1.69
左足の長さ            25.6cm   1.69
(右足の長さ)−(左足の長さ) 0.2cm 0.04

(1)右足の長さと左足の長さの相関係数を求めよ。
(2)右足は左足より長いといえるかどうかを、有意水準1%で検定せよ。
必要ならば、不等式 2.338<t(0.02、99)<2.390と、近似式 99の平方根=9.95を、用いよ。

お願いします。
          

250 :132人目の素数さん:2006/06/28(水) 20:06:26
>>249 この問題ほんとか? ごめん わかんね


251 :132人目の素数さん:2006/06/28(水) 20:39:28
>>250 ほんとなんです。考えてもらえただけでありがたいです。

では、この問題わかる方いますか?
お願いします。統計の問題で帰無仮説と対立仮説についてです。

正味が200グラムと表示されているA社とB社のバターを、それぞれ10個ランダムに取り出して
その重さを量った。A社の10個のバターの重さは、互いに独立で同一の正規分布に従うものとする。
B社の10個のバターについても同じとする。
ただしA社のバターの母集団平均とB社のバターの母集団平均は等しいとは限らないが、それぞれの
母集団分散は等しいとする。
A社の10個のバターの重さの平均は205.2グラムであり、標本分散は20であった。
B社の10個のバターの重さの平均は201.6グラムであり、標本分散は16であった。
(1)このとき最も適切な帰無仮説と対立仮説はなにか?
(2)有意水準を5%として検定せよ。必要ならば、t(0.1、18)=1.734
t(0.057、18)=2.101を用いよ。

おねがいします。

252 :132人目の素数さん:2006/06/28(水) 23:50:22
どう見ても宿題じゃねえの?
1問ぐらい自分で解かせるかその爺に文句を言わせるのが吉かと。

253 :132人目の素数さん:2006/06/29(木) 01:28:16
>>242
>>246
仮説の立て方が間違ってるけどな。
(もちろん2)の解答も違ってくる)
ここの解答を鵜呑みにして宿題提出すると恥かくかもよ。


254 :132人目の素数さん:2006/06/29(木) 07:55:46
>>253
つか仮説の立て方間違え様がなくね
242&246どう間違えてるか説明してみ。

255 :132人目の素数さん:2006/06/29(木) 16:26:04
>>253 すいませんが恥かくと煽るだけでなくどう間違ってるとか書いてくれると
助かるんですけども

256 :132人目の素数さん:2006/06/29(木) 22:49:26
>>254
うむ。これほど低レベルとは…。
片側検定って知ってますか?


257 :132人目の素数さん:2006/06/29(木) 23:05:32
>>256
きみ面白いね。片側、両側云々言ってちゃ笑われるよ。
それでレベルが低いって?

258 :132人目の素数さん:2006/06/30(金) 00:37:48
>>257
ふむ。何でも両側主義の人か。まあそれもよかろう。
しかし、件の問題は教科書のものだろうから片側でないと
×となるであろう。


259 :132人目の素数さん:2006/06/30(金) 05:31:56
>>258
必要ならばt(0.1,v)=XXXというのが両側基準になってるんです。
つべこべ言ってないで>249を答えてもらえる事はできないでしょうか?
よろしくお願いします!


260 :132人目の素数さん:2006/06/30(金) 07:12:28
ちょっと感動したw

261 :132人目の素数さん:2006/07/02(日) 14:00:42
かなり感動したw じいさんと呼ばれてる人も大変だ。

>>243
この本に数ページだけど書いてありました。
ttp://www.amazon.co.jp/exec/obidos/ASIN/4254127812/
持っていないので確認できないけれど、
岩波の統計科学のフロンティアのどれかにも書いてあったかも。

262 :132人目の素数さん:2006/07/02(日) 16:57:46
当方、法学徒なのですが・・・なぜか数理科学を取ってしまいチンプンカンプンです。
フラメンゴ関連係数(なぜかぐぐってもでない)に付いての質問です。
以下講義板書要略

x2乗=6.6231
φ=√x2乗/n×e=√6.6231/230×(2−1)=0.169・・・

上記の計算過程で、0.169・・・になる意味が分かりません

冷淡な熟女教師で、質問しても無視されて困ってます
宜しくお願い申し上げます。


263 :132人目の素数さん:2006/07/02(日) 17:25:20
>>260 >>261
感動したとか言ってるだけど、質問に出ている問題を答える事が
できないんだね。こんなところで答えても仕方がないとかあれこれ
言い訳に始終するだけだろなw

プロペンシティスコアを初歩的な事からおしてえくれって言ってんのに
本のリンクとフロンティア出しちゃうんだ。かなり感動w

264 :132人目の素数さん:2006/07/02(日) 17:25:33
以下講義での板書(完全版)

・進学した人のデータ
性別と文理との関係

  男   女  計
文 88  71 159
理 52  19 71
計 140 90 230

・2つのデータの関連

期待度数 140×159/230=96.8
     90×159/230=62.2
     140×71/230=43.2
     90×71/230=27.78

X2乗=(88−96.8)2乗/96.8+(71−62.2)2乗/62.2+(52−43.2)2乗+(19−27.8)2乗/27.8
   =0.8+1.245+1.7925+2.7856=6.6231

φ=√x2乗/n×e=√6.6231/230×(2−1)=【0.169・・・】←この計算過程で、0.169・・・になる意味が分かりません

0≦φ<0.2
無関係

天才的な貴兄諸氏なら回答できまつよね♪

宜しくお願い申し上げます。


265 :132人目の素数さん:2006/07/02(日) 17:25:54
感動

266 :132人目の素数さん:2006/07/02(日) 17:32:16
>>262>>264
宜しくお願い申し上げます。


267 :132人目の素数さん:2006/07/02(日) 17:44:44
>261の感動wさんお願いしますw

268 :132人目の素数さん:2006/07/02(日) 17:50:22
>>264
よくわかんないけど
xの2乗をx^2と書く。
√x を x^{1/2}とかく。

そうすると
(6.6231/230)^{1/2}×(2−1)=0.169・・・

ルートの傘が足りないだけ。

269 :132人目の素数さん:2006/07/02(日) 17:55:45
>>268さんあり!それが開平法って奴でつかね・・・まぁ勉強してみまつ・・・・

270 :132人目の素数さん:2006/07/02(日) 18:21:14
つべこべ言ってないで>249を答えてもらえる事はできないでしょうか?
よろしくお願いします!

271 :法学徒:2006/07/02(日) 18:23:26
当方は、厨房時代に代数が得意だったのですが・・・6年ぶりに数学に接して死にそうでつ・・・

おススメの【統計学の超初心者本】があれば御推薦よろ!

272 :132人目の素数さん:2006/07/02(日) 20:01:37
>>263
言い訳なんかしないよw 俺の能力では答えられなくて傍観してたからね。
俺が感動したのは質問しているのに「つべこべ言ってないで」と言ってのけるとこ。
当然プロペンシティスコアを初心者に説明する能力なんて無いけど、
>>243がスルーされてたので、レスがないままよりましかと思って、
たまたま見つけた本を書いただけ。
書かない方が良かったのなら>>243へも含めてあやまるよ。

273 :132人目の素数さん:2006/07/02(日) 22:42:59
>>249

右足と左足をXやYと適当に読み替えてくれ。

V(X)=a
V(Y)=b
V{XーY}=V(X)+V(Y)ー2Cov(X,Y)=c

これをCov(X,Y)について解けば、
V(X)、V(Y)と合わせて相関係数が計算できる。
こんなところじゃないか。
合っている保証は無いが、
あなたがどうなろうと知ったことではないので悪しからず。


274 :132人目の素数さん:2006/07/03(月) 23:21:27
[問1]連続的確率変数 X1 X2 が互いに独立で、それぞれの確率密度関数が f1(x1) f2(x2) のとき、
確率変数 Y = X1 + X2 の確率密度関数 g(y) をf1,f2を用いて表しなさい
f1(x1)>0,f2(x2)>0,−∞<x1<∞,−∞<x2<∞ とする
hint:2変量確率変数(X1,X2)から2変量確率変数(Y,Z)への1対1変換を考えればよい[Y=X1+X2 , Z=X1]

[問2]連続的確率変数 X1 X2 が互いに独立で,それぞれ正規分布 N(μ1,{σ1}^2) N(μ2,{σ2}^2) に従うとき、
確率変数 Y = X1 + X2 が正規分布に従うことを示しなさい
hint:問1の結果を利用するとよい、また s=(t-μ)/(σ1σ2) とおくとよい.


この問題お願いしますm(__)m


275 :132人目の素数さん:2006/07/04(火) 01:36:14



○○社で大規模爆発事故
原因は面接に来た学生のイオナズン

3月1日午後、○○社(東京中央区)で大規模な爆発事故が発生し、
社員ら約300名が100以上のダメージの大怪我を負った。死者はいない模様。
原因は面接に来た学生が唱えたイオナズンと見られている。
「イオナズンを使うぞ」「使えるものなら使ってみろ」といった押し問答の後、
逆上した学生がイオナズンを唱えたという。
「どうせMPが足りないと思っていた。まさか本当に使うとは」
(面接を担当した○○社の社員)
「最近の若者はすぐにキレやすいし、MPも10年前に比べると
格段に増えている。マホカンタやマホトーンなど自分で自分を
守らないといけない」と関東学院大学牛島助教授(呪文心理学)は警告する。

276 :132人目の素数さん:2006/07/04(火) 02:17:53
>>274
h(y,z)=f1(x1)f2(x2)*|det(∂(x1,x2)/∂(y,z))|=f1(z)f2(y-z)
g(y) = ∫[-∞,∞] f1(z)f2(y-z)dz

g(y) = {1/(2πσ1σ2)}∫[-∞,∞] exp{-(z-μ1)^2/(2σ1^2))}*exp{-(y-z-μ2)^2/(2σ2^2)} dz
= {1/(2πσ1σ2)}∫[-∞,∞] exp{-(z-μ1)^2/(2σ1^2))}*exp{-(y-z-μ2)^2/(2σ2^2)} dz
マンドクセ、ネヨ。

277 :274:2006/07/04(火) 02:34:17
OTL なんかやたら難しい・・・。

278 :132人目の素数さん:2006/07/05(水) 00:13:31
ここでのAICはどういった手順で計算されているのでしょうか?
モデルがなくてもAICは計算可能?

--------------------

「中流意識」の説明要因(坂元1994)

順位    質問                           AIC
1  いまの生活はどの程度幸せか              -110.95
2  満足できる水準ー経済的に豊かに暮らすこと      -96.65
3  家庭生活にどの程度満足か                -90.76 
4  いまの生活にどの程度満足か               -81.74
5  収入                               -77.21
6  レジャー生活の妨げー収入不足              -76.00
7  所有・経験項目ー一流レストランでの食事(家族で) -75.76
8  満足していること: 衣生活                 -62.99
9  毎日の生活は面白いか                   -57.88
10  何割の収入増加をのぞむか                -53.57

279 :132人目の素数さん:2006/07/05(水) 00:29:06
>>278
それってここから持ってきたのじゃないの?
http://tswww.ism.ac.jp/kitagawa/Ds991/index.htm
そうならAICの式が出てるけど。


280 :132人目の素数さん:2006/07/05(水) 00:31:18
アンケートでいつも、中流ってなにとか、問いの厳密な定義が不明で、
わからないにまるしたくなる衝動にかられるのは異常でしょうか?

中流って下流と上流の間だから扇状地のヒトには楽かも?

281 :132人目の素数さん:2006/07/05(水) 00:49:23
扇状地なら中流かw

まあ、中流がよく分からないから調査するんだろうね。
>>278 の日本人の結果からすると「いまの生活はどの程度幸せか」
に反応する人が一番「中流」という意識を持っているってことだね。
しかし、順位2位から10位までを見ると意識があやふやであることが
よく分かる。上のURLではアメリカの結果も出てるけど
アメリカでの「中流」意識は「収入」が一番である意味分かりやすいね。


282 :132人目の素数さん:2006/07/05(水) 01:31:30
レスありがとうございました。
ところでcatdapってなんて読むのですか?

283 :132人目の素数さん:2006/07/05(水) 09:54:53
>>282
キャットダップだそうだ。
http://www.ism.ac.jp/computer_system/software_j.html



284 :132人目の素数さん:2006/07/06(木) 01:47:54
svm詳しい人いる?

285 :132人目の素数さん:2006/07/06(木) 07:25:00
>>232

尤度と確率は違うよ。

286 :132人目の素数さん:2006/07/06(木) 07:30:59
>>234

>尤度関数は確率を掛け合わせたものだと思っています。

これは正しいけど、

>例えば正規分布の確率密度関数の値域が1を超える事があるということでしょうか?
>これが1を超えるのが想像できません。

ここがちょっと混乱気味。
例えば幾何学的に話をすると、次のような例を考えてみて。
今3次元空間に、xとyが互いに独立な

z=f(x,y)

と言う2変数関数があるとします。
例えばこの関数zが、−∞<x<∞で積分して、

∫f(x,y)dx=1

だとしましょう。
ただし、仮にこう言う関数があったとしても、−∞<y<∞の範囲で、

∫f(x,y)dy=1???

になる、って保障がありますか?

287 :132人目の素数さん:2006/07/06(木) 11:52:58
>>286 ないです

288 :132人目の素数さん:2006/07/06(木) 17:31:33
既に>>239があるんだが
積分の値でなく、関数の値のはなし
と、思ふ

289 :132人目の素数さん:2006/07/06(木) 22:14:08
「無相関であっても独立とは言えず、
無相関であっても直交であるとは言えない」
という証明をしたいのですが、アドバイスをお願いします。

290 :132人目の素数さん:2006/07/06(木) 22:58:28
>>289
とりあえず
無相関
独立
直交
の定義を書いてみて

291 :132人目の素数さん:2006/07/06(木) 23:22:47
>>289
その条件を満たす具体例を作ればよいだけ

292 :132人目の素数さん:2006/07/07(金) 19:43:16
同じ定義域のsinとcosは無相関だけど独立じゃないよね。
直交はしてるのかな?

293 :132人目の素数さん:2006/07/07(金) 20:39:14
確率を足して割る(平均をとる)ことに意味がないのは
どうしてなんでしょうか?

294 :132人目の素数さん:2006/07/07(金) 21:17:16
別に確率に限らず、特に理由も無く
足したり割ったりすることには大抵意味が無いと思うが

295 :132人目の素数さん:2006/07/07(金) 21:47:28
点数の平均点には意味があるでしょ?
確率の平均にはなんで意味がないんでしょうか?
と聞いているのです。

296 :132人目の素数さん:2006/07/07(金) 21:49:56
「確率の平均」をどのように定義するのか興味がある。

297 :132人目の素数さん:2006/07/07(金) 21:52:58
たとえばどういう場合だよ
確率の平均を考える場合って

298 :132人目の素数さん:2006/07/07(金) 22:07:59
降水確率を1か月分足して30で割る、とかです。

299 :132人目の素数さん:2006/07/07(金) 22:36:27
>>298
それは「確率の平均」ではないよ

300 :132人目の素数さん:2006/07/08(土) 00:07:47
確率の平均ってなんだ?

301 :132人目の素数さん:2006/07/08(土) 01:53:13
>>299
じゃあ>>298の値はいったい何なんですか?

302 :132人目の素数さん:2006/07/08(土) 07:51:36
定義定義と馬鹿のひとつ覚えが約一名

303 :132人目の素数さん:2006/07/08(土) 08:17:42
確率の平均、大いに結構!

304 :132人目の素数さん:2006/07/08(土) 11:27:25
確率空間の平均も忘れずに!

305 :132人目の素数さん:2006/07/08(土) 12:17:52
>>302
逆切れしてスルーされた教えて君ですかな?
どこが悪かったか反省しましょうね。

306 :132人目の素数さん:2006/07/08(土) 12:55:06
>>305 しましょうね

307 :132人目の素数さん:2006/07/08(土) 14:59:48
降水確率平均で一番高いのはツユの月なんでしょうか?

308 :132人目の素数さん:2006/07/09(日) 13:56:06
BonferroniとTukeyの多重比較はどう使いわければいいのでしょうか??

309 :132人目の素数さん:2006/07/10(月) 09:00:42
>>307
気象庁にれっつごー

310 :132人目の素数さん:2006/07/10(月) 09:01:16
>>308


>305さんどうぞ

311 :132人目の素数さん:2006/07/10(月) 09:56:08
教官がテストで「私も公式覚えてないですから教科書持ち込んでもOKです」
って言ってたけど(たぶん検定についての公式)、これって普通なの?

312 :132人目の素数さん:2006/07/10(月) 11:34:41
>>293
必ずしも意味は無くはないよ。

例えば、2種類のくじがあって、1つは10本中当たりが1本、1つは10本中当たりが2本とする。
要は当たる確率10%のくじと20%のくじがあって、無作為に一方のくじを選んで1本引く、という状況を考える。

この場合、引く人の当たる確率は、10%*(1/2)+20%*(1/2)=15%という、単純平均の計算でいい。
10%、20%という確率の数値自体が確率変数で、それぞれを1/2の確率で取るため、その期待値を計算してるということになる。

確率を単純に足して割るという作業は、そのそれぞれの確率を等確率で取る場合の期待値、という考え方において得られた結果としては確率としての意味があるということ。

ただ、>>298の降水確率の例は、単に気象庁が発表した降水確率の単純平均値、という指標としての意味はあるけど、その得られたパーセンテージには具体的な確率としての意味はつけづらいね。

無理やり確率としての意味を持たした説明をつけるなら、この先1ヶ月の降水確率が与えられており、そのうち1日だけ外出する人がいてどの日に外出するかは分からない。
降水確率が正しいとして、この人が外出した日に雨に降られる確率は?っていう感じかね。

313 :132人目の素数さん:2006/07/11(火) 23:46:46
>>312
>必ずしも意味は無くはないよ。

この言い方からすると、数学において、確率を足して割ると言う行為は
行われていないのでしょうか?

314 :132人目の素数さん:2006/07/11(火) 23:49:48
自分で考えない人は教科書を鵜呑みにする方が良い思うよ

315 :132人目の素数さん:2006/07/12(水) 10:05:04
>>313
>>312の例とかでしっくり来ないんなら、一般的にはそう思っておいてもいいよ。

本来は、行われていないとか、やってはいけないとかではなく、特に理由もなく単純に足して割るという作業はしない、ってことだけど。

で、確率の場合はあなたが思ってる平均点とかのような感覚(標本平均だな)での定式化が意味を成す場合の方が特殊な状況である、ってこと。

316 :132人目の素数さん:2006/07/13(木) 22:44:13
「中央値・最頻値・平均値」の3つセットであらわす統計学的な意味とは何ですかね?
それと、「変化係数、標準偏差」の2つセットであらわす統計学的な意味とは何ですか?

317 :132人目の素数さん:2006/07/14(金) 16:51:41
平均の差のt検定と変動係数について質問です。

平均の差のt検定
2005年の野球チームAの全選手の平均打率と2006年の野球チームAの全選手の平均打率の
差に有意な差があるかどうかを検証したい。
2005年と2006年では、選手の数が違うが全選手の打率が分かるので、標本平均ではなく、
平均の差のt検定を行わなくても、単に平均が違うかどうか比べればいい気もします。

変動係数
上の例を使って、2005年と2006年の変動係数を比べる事に意味はありますか?

以上2点分かる人教えて下さい。

318 :132人目の素数さん:2006/07/14(金) 20:50:07
>>315
ということは確率の標準偏差なども
数学においては、ないのでしょうか?
確率のバラツキというものはありそうな気がするのですが。
例えば降水確率のばらつきとか、です。

319 :132人目の素数さん:2006/07/15(土) 00:34:13
>>319
それは「降水確率」という数値を、テストの点数とかと同じような、「一つの標本の値」と捉えれば、もちろん考えられるよ。

>>312が「気象庁が発表した降水確率の単純平均値、という指標」って書いているのはそういう意味だ。

ただ、例えばその結果出てきた6月の平均が60%だったとしても、その60%という数値が、「6月は平均して雨が1日当たり60%の確率で降る」などと言う意味になるか、っつうとそれは違うんじゃね?、っていうお話。


320 :132人目の素数さん:2006/07/15(土) 07:58:42
>>318
まず「降水確率」の意味を理解しろ。
そうすればやたら平均を取ったって意味がないことに気づくはずだ。
というかなんでそんなに平均とか標準偏差とか計算したがるのよ?

321 :132人目の素数さん:2006/07/16(日) 20:40:04
質問です。
ある製品の使用者からその製品の感想を聞きだしてレポートにまとめたく思っています。
ただ、その製品を所有している人は珍しく、無作為に人を集めても1%しか所有していません。
100人から製品の感想を聞きだしたいとしたら最初に何人の人を無作為に集めればいいのでしょうか?
単純に考えれば、100÷0.01=10000となり一万人集めれば良いような気がしますが、
統計的に誤差まで考えるとどのようになるのでしょうか?
アドバイスよろしくお願いします。

322 :132人目の素数さん:2006/07/16(日) 20:43:56
>>321
> ただ、その製品を所有している人は珍しく、無作為に人を集めても1%しか所有していません。

1%の人間が持っているなら大ヒット製品だろ。

323 :132人目の素数さん:2006/07/16(日) 20:46:42
>>322
早速のレスありがとうございます。

ですが、その仮定の元で教えてください。

0.01%の人でも良いのですが、
あまりに所有率が低すぎるとまた手法が変わってくるのでしょうか?

324 :322:2006/07/16(日) 20:52:48
>>323
特定製品の感想を聞くならユーザー登録情報や販売履歴を使って
使用者を特定すべきだよ。無作為にアンケート用紙を配布しても
回答する人間が本当に使用者かどうかわからないし、
そもそも不特定多数の人間に情報を送りつけるのは迷惑行為だから
松下の石油ファンヒーターのように人の生死に関わるケースに限定すべき。

325 :132人目の素数さん:2006/07/16(日) 20:56:22
>>324
おっしゃる通りだと思います。
ですが、無作為に人を集めるという仮定の元で教えて頂けないでしょうか?
よろしくお願いします。

326 :132人目の素数さん:2006/07/16(日) 21:37:09
√10,000×0.01×0.09 = 3
10,000人集めれば標準偏差が3で誤差は3人程度と思って間違いないでしょうか?

327 :132人目の素数さん:2006/07/16(日) 22:06:57
326です。

Rで n = 10000 p = 1%の2項分布で標準偏差をシミュレートしてみました。

> sd ( rbinom ( 1000000 , 10000 , 0.01 ) )
[1] 9.955702

理論上の標準偏差
√10,000×0.01×0.09 = 3
と大きく違うような気がしますがどういう事でしょうか?

328 :132人目の素数さん:2006/07/17(月) 10:11:43
>>327
あのー、理論は
√10,000×0.01×0.99 = 9.949874
では?


329 :132人目の素数さん:2006/07/17(月) 11:52:13
>√10,000×0.01×0.99 = 9.949874

そうですね。間違いました。

ふと疑問に思ったので質問です。
A → B → C
  5%  1%

の時、
A → C は、 5%×1%で0.05%となりますが、
A → Cが、0.05%の2項分布に従うと考えていいのでしょうか?

330 :132人目の素数さん:2006/07/17(月) 18:57:42
大学の宿題の問題なのですが、分からないのでお願いします。

確率過程X(t)、t≧0 がブラウン運動に従うとき、次の問いに答えよ。

(1) X(t) = {X(t) - X(0)} + X(0)の 期待値と分散を求めよ。

(2) X(t)、X(s) の相関係数を求めよ 。(s>t)

分かる方、教えて下さい。宜しくお願いします。

331 :132人目の素数さん:2006/07/18(火) 04:40:31
サイコロを2つ振るという試行を60回繰り返した時に、出た目の和が4よりも少なくなる回数の平均と分散をお願いします

332 :132人目の素数さん:2006/07/18(火) 19:58:30
分散と共分散を教えてください

333 :132人目の素数さん:2006/07/19(水) 03:12:45
>>330
(1) E(X(t)) = 0
V(X(t)) = E({X(t) - X(0)}^2) - E({X(t) - X(0)})^2 = t

(2) Cov(X(t),X(s)) = E(X(t)X(s)) - E(X(t))E(X(s))
= E(X(t)(X(s)-X(t)) + X(t)^2) - 0
= E(X(t))E(X(s)-X(t)) + E(X(t)^2)
= 0 + V(X(t))
= t

334 :132人目の素数さん:2006/07/19(水) 21:38:53
>>330
遅い時間に本当にありがとうございます。
かなり助かりました。

335 :132人目の素数さん:2006/07/19(水) 22:06:32
アンカー間違えました…
>>333様です

336 :132人目の素数さん:2006/07/19(水) 22:28:32
確率分布関数,頻度関数,密度関数がいまいちわかりません.
分布関数が
連続の時 密度関数(分布関数を微分したもの)に対応する.
離散の時 頻度関数(分布関数の上昇分)に対応する.

ということでいいのでしょうか.

また,現在はベクトルや微分はできるかぎり使用せず勉強をしているのですが,
次のステップの教科書にできるような図書があれば教えてください.
現在の教科書は 基本統計学3版 宮川公男 です.

337 :132人目の素数さん:2006/07/19(水) 23:03:41
これだから文系はバカって言われちゃうんだよw

338 :132人目の素数さん:2006/07/20(木) 16:08:51
今かなり困ってます!!どなたかこの正規分布の問題のとき方教えて下さい!!(*p≧дq)

「ある女子大学の学生の平均身長は160cm、標準偏差5cmで正規分布しているN(160cm,(5cm)2)。」
(ア)朝、大学にきてはじめて見かけた学生の身長が165cm以上である確率は、70%より大きいか小さいか。

(イ)翌日、大学に行ったとき最初に見かけた学生に身長を尋ねたら、169.8cmだった。学内で彼女以上に身長が高い人の割合は何%だと予想されるか。


本当にこまっているのでどなたかよろしくお願いします………

339 :132人目の素数さん:2006/07/20(木) 17:58:33
どなたかおしえてください(ρ□;)

340 :132人目の素数さん:2006/07/20(木) 18:32:26
> (*p≧дq)
有意差の記号ですか?

341 :132人目の素数さん:2006/07/20(木) 18:52:28
ttp://general.livedoor.biz/?blog_id=431334

アフィサイトへの転載は禁止だお


342 :132人目の素数さん :2006/07/21(金) 22:20:00
>>338
ヒント:標準正規分布表

343 :132人目の素数さん:2006/07/22(土) 22:45:40
>>338
(ア)は問題を作った人間のセンスを疑うんだが。30%ならともかく。
(イ)は5*1.96=9.8か、偏差値70だな。

344 :132人目の素数さん:2006/07/22(土) 23:12:27
>>343
まじめに考えようとしたが、(ア)はよく見ると、
「平均よりも1標準偏差以上高い学生」が全体の半分以上いるか?
ということか。センスというより常識がないな。
(イ)は学内で彼女以上に身長が高い「人」だから、教官や事務職員も含む、という
引っかけ問題に違いない。
結論としては、これは正確に問題文を読めるかどうかを試す問題なんだろう。


345 :132人目の素数さん:2006/07/23(日) 05:12:49
弱定常性とエルゴード性とは何でしょうか。
教科書に載っていなくて困っています。
ご存知の方、教えてください!

346 :132人目の素数さん:2006/07/23(日) 05:47:03
経済学部で統計学の授業を取ってるんですが、テキストが難しくてわかりません。
わかりやすいサイトや参考書ありますか?

347 :132人目の素数さん:2006/07/23(日) 06:10:56
友達に聞け。
いないなら自殺しろ

348 :132人目の素数さん:2006/07/23(日) 06:18:43
>>346
その難しいテキスト名くらい書きなよ。

349 :132人目の素数さん:2006/07/23(日) 06:38:41
受験科目を減らすとその大学の偏差値が上がると聞いたのですが
どういうカラクリなんでしょうか?
聞いた話なのですが、偏差値を上げるために、
2教科にしたり1教科にしたりしている大学があるそうです。
私立大学は大抵3教科であり、5教科の私立大学はないですよね。
やはり何かからくりがあるはずです。
よろしくお願いします。

350 :132人目の素数さん:2006/07/23(日) 06:45:23
誰が言ってたんだよ。
偏差値操作なら人数の方をいじくるのが普通。

351 :132人目の素数さん:2006/07/23(日) 06:48:18
>>347
いませんorz
>>348
新経済学ライブラリー−9 統計学入門第2版 森棟公夫著 新世社
です。

超基本的な質問なんですけど、分散がわかりません。
定義はわかりますが、分散の指し示す数値の意味がわからないのです。
「中心からの散らばりを示す」っていうのはわかりますが、数値の持つ意味がわからないのです。
例えば、テキストの数値を使いますが
26,24,21,19,19,18.5,18,18,15,14,13,12,12,11,8,6,6,6,2
っていう数値があります。
平均値は14,3です。これはの意味はわかるんです、あたりまえですけどw。単純に、並べられた数値の中間的な数字ですよね。(中央値とは異なることぐらいわかりますよw)
でも分散って、計算すれば42,1とでますが、この「42,1」という数値の意味がわからないんですよ。
中心からの散らばりを示す、という定義で42,1とはどんな意味を持つんですか?
ちょっとわかりにくい日本語かもしれませんが・・・


352 :132人目の素数さん:2006/07/23(日) 06:50:28
>平均値は14,3です。これはの意味はわかるんです
>これはの
   
  ↓

>この数値の

です。


353 :132人目の素数さん:2006/07/23(日) 12:26:38
>>349
それは統計学の問題ではないのでは?
教科数を減らすと、受験者数が増えるとか
2教科なり1教科のみ得意な受験者の割合が増すとか
偏差値はあくまでも相対的なものですから、残った教科において、その大学の地位が上がる
ということでは?

>私立大学は大抵3教科
いまやそうは言えないでしょう。2教科や1教科、ゼロ教科(作文のみとか、面接のみとか)
の私大がごろごろです。

354 :132人目の素数さん:2006/07/23(日) 12:59:41
>>344
なるほど

>>345
弱定常 E(X(t)X(t+h))がhだけに依存してtによらないだったような。
エルゴード 確率過程で時間で平均とったものと標本空間で平均とったものと同じだったかな?
なんか別の本見たほうがいいよ。

>>346
大村平、蓑谷・・・の「〜のはなし」。


355 :132人目の素数さん:2006/07/23(日) 13:05:46
【爆 笑 問 題  VS  東 京 大 学】

もはや説明不要の日本の最高学府、東大に
爆笑問題が挑発的な問題提起をする!!

会場は、数多くの東大の学生諸君に囲まれ
前線には、東大の教授陣が睨みをきかせている緊張感の中
我らが爆笑問題は、いた!

90分間、あなたは見たこともない光景の中で
毒舌を吐き、教養を語る
太田光の姿を見ることになるだろう

だが、教授陣も学生も黙っていられない
大蛇太田に、最高学府のプライドを持って
反撃する!

爆笑問題が『笑われるのか』、『笑わせられるのか』
貴方自身の目で、この伝説の光景を確かめてほしい・・・

(Part1) http://www.youtube.com/watch?v=UopvktceXS4
(Part2) http://www.youtube.com/watch?v=UGh-Kr2MDQU
(Part3) http://www.youtube.com/watch?v=4dbaY8Yb3E0
(Part4) http://www.youtube.com/watch?v=7Yyar_hoKYw
(Part5) http://www.youtube.com/watch?v=xcphQUht2Rs
(Part6) http://www.youtube.com/watch?v=lUUEVSH7rbI
(Part7) http://www.youtube.com/watch?v=EdERtUE86fU
(Part8) http://www.youtube.com/watch?v=OrlIWhRpKok
(Part9) http://www.youtube.com/watch?v=QX2bH6LH0oI

356 :132人目の素数さん:2006/07/23(日) 20:53:15
>>351
分散に絶対的な意味を持たせるのが無理だから標準偏差があるのでは?


357 :132人目の素数さん:2006/07/24(月) 00:33:37
>>351
>中心からの散らばりを示す、という定義で42,1とはどんな意味を持つんですか?

そこに「解釈」つまり「主観」の入る余地があるということだ。
でも数学に主観が入っちゃマズイと僕は思うんだよね。

358 :132人目の素数さん:2006/07/24(月) 00:57:46
自己相関と偏自己相関を定義すると、どのように定義すれば良いでしょうか??
どなたか教えてください。

359 :132人目の素数さん:2006/07/25(火) 00:08:06
y = ε (εは標準正規分布)の尤度って求められますか??
アドバイスよろしくお願いします。

360 :132人目の素数さん:2006/07/25(火) 02:10:09
当方経済学部ですが、数学科でも統計学って学ぶんですか?

361 :132人目の素数さん:2006/07/25(火) 16:05:23

二次元のグラフ(二次元ベクトル複数個を線つなげた)が二つあり、
どっちが (右肩上がりのグラフの場合)右下にあるか、
というのを比べるにはどういう方法があるのでしょうか?

グラフが交差してる部分があり、一目瞭然でどちらが上ということを判定できない
場合を想定してます。



362 :132人目の素数さん:2006/07/25(火) 23:40:02
>359

そんなこともわからないのかw

Π(確率密度)


363 :132人目の素数さん:2006/07/26(水) 14:50:48
漸近正規性を初めて発見したのって誰なんですか?

364 :132人目の素数さん:2006/07/26(水) 14:54:19
Fisherではないだろうか?

365 :132人目の素数さん:2006/07/26(水) 15:35:01
いや,もっと前から知られていたように思います.
Fisherが漸近正規性を用いて有効性を定義したのが1922年ですので,
それ以前から知られていたはず.
ピアソン辺りかなぁ・・・

366 :132人目の素数さん:2006/07/26(水) 23:15:31
>>362
うそつけ

367 :361:2006/07/27(木) 09:07:59
2次元(多次元)のグラフ2本の組が多数あり
一方がもう一方と比べて差があることを示したいのですが、

こういうデータに対して二つのグラフは同一の母集団であるという帰無仮説を棄却するた
仮説検定にはどのようなものがあるでしょうか?


368 :132人目の素数さん:2006/07/27(木) 11:04:14
>>367
グラフと言うことでデータに順序があるようですが、
それは時系列と言うことですか?2本のグラフで対応する
点があるということですか?


369 :361:2006/07/27(木) 13:29:34
グラフというのは、 y=f(x) というある種の関数だと思ってください f() の中身がどうなってるかは未知
このf(x) と、 f'(x)とに差があるかないか、 誤差の範囲内であるかどうかを検定したいんですが
この y=f(x) について情報取得の制約条件として、任意のxを入力して、その時のf(x)を取得することはできない。 
つまり、f(x)とf'(x) についての x,f(x) の組のいくつかの集合だけが 与えられる。

例えば、f(x)では
  x     f(x)
0.49726 0.30526
0.48548 0.30526
0.47408 0.33684
0.46456 0.33684
0.45221 0.33684

f'(x)では
  x   f'(x)
0.49453 0.26315
0.48435 0.26315
0.47247 0.29473
0.46163 0.32631
0.45070 0.34736
というように二次元の点だけが(見えるデータとして)与えられる
(実際にはこれら点の間にも要素が間違いなくある)
だから、点の間を補完する形としてグラフなんです
      (↑この考えは間違いかもしれません)

370 :132人目の素数さん:2006/07/27(木) 21:28:14
むりやり
コルモゴルフ-スミルノフ
フォン ミーゼス


371 :132人目の素数さん:2006/07/28(金) 13:21:10
ある大手コンビニエンスストアはアルバイトの学生の平均勤務時間に
ついてデータを求めようとしている。
東武線沿線の店で働くアルバイトの学生から64名を無作為に選び、週
の平均勤務時間を調査した。昨年までの調査結果に基づくと、全アル
バイト学生の勤務時間の標準偏差は4時間であることが分かっている。
このとき、標本平均と母平均の差が、1時間を超える確率はいくつ
か?
結果だけではなく、その過程の式やグラフを示すこと。

この問題の解き方を教えていただけませんか?


372 :132人目の素数さん:2006/07/28(金) 18:26:12
確率はわからないなあ。チェビシェフで上から評価はできるけど。

373 :132人目の素数さん:2006/07/28(金) 21:21:58
二項分布について。

B(1.5a, 0.1)
B(a, 0.15)

収束が早いのはどっちですか
面倒でなければ理由も合わせてお願いします

374 :132人目の素数さん:2006/07/28(金) 21:33:37
What we suggest here is a kind of different game: analytic
continuation from the real line to the complex plane, with its
flat euchdean geometry, is not the same as going from the real
line (or from the circle) to the Poincare upper half-plane (or
to the disk), with its curved Lobatchevskian geometry. This
one-dimensional (complex) comparison (and contrast) sits at the
roots of the message carried by the authors of [3]. Our belief
is that Physics is "simple" (and euclidean) in the domain D and
that many of the difficulties of classical or quantum physics
arise because we try to go to the "boundary" and to formulate
the laws of Physics there.

375 :132人目の素数さん:2006/07/28(金) 22:57:06
>>370
>>369から考えると分布の話ではないから分布比較の検定法は
使えないやろ。
データの点の数が揃ってるけどそれに意味がある(対応している)
のかなあ。
関数形がある程度推測つくならそちらから考えるのかな。


376 :361:2006/07/30(日) 10:22:14
データの点の数がそろってることには意味はないです。
例として同じ個数の系列を出しました。

値域には次のような上限と下限があります。
(0,1というのはそれほど意味はないです)
0≦x≦1  0≦f(x)≦1

xの増加に伴ってf(x)は単調減少することは保障されてます。
xとf(x)は1対1対応してるので、f()の逆関数もあります。



377 :132人目の素数さん:2006/07/30(日) 18:28:18
で、関数形は決まっていないのでしょうか?


378 :132人目の素数さん:2006/07/31(月) 01:52:36
http://www.imgup.org/iup240733.jpg
(3)は分かるけど、(2)の解き方が分かりません。教えてください!1

379 :132人目の素数さん:2006/07/31(月) 08:50:04
>>378
標本分散 s^2 = {1/(n-1)}Σ(xi-x~)^2 =15^2 を使う
(x~-208)/(s/2) は自由度3のt分布に従うので
P(x~≦196) = P((x~-208)/(s/2)≦-1.6) = 0.1

380 :361:2006/07/31(月) 15:09:45
377

関数がどのような形になってるかは全く不明です。
ただ出力 x,f(x)の値のみから推測するしかないような形です。



381 :378:2006/07/31(月) 18:50:53
>>379
遅くなりましたが、分かりました。ありがとうございます。

382 :132人目の素数さん:2006/07/31(月) 22:50:17
>>380
せめてxを揃えて観測できるとかでないと比較しにくいなあ。
(xは0から1まで0.1刻みで固定とか)


383 :132人目の素数さん:2006/08/02(水) 00:08:31
学校の実習で、授業評価アンケートをwebでシステム化するということになったんですが、
web画面で学生にアンケート(採点方式)に答えてもらって、それをプログラムで自動集計するようにしたいんです。
ただ統計学の知識がないので、集計の結果最終的に表示するデータは、授業ごと、項目ごとの合計点や平均点を出すくらいしか思いつきません。
実際に見て役に立つデータにするには、どういった加工が必要でしょうか?


384 :132人目の素数さん:2006/08/02(水) 00:13:49
好きな授業ベスト10とかのランキング方式がわかりやすい?


385 :132人目の素数さん:2006/08/03(木) 03:07:57
混合正規分布を推定するEMアルゴリズムの対数尤度を最大にするように、
分布の重み、平均、分散で対数尤度を微分して尤度が最大になるパラメータを計算したんですが、
一般的に使われている形にどうしてもなりません。
(大体は合っているけれど、一部の定数が合わない。
自分で計算した結果を用いると尤度が下がってしまう・・・)

どこかに証明が乗っているサイトか、お勧めの書籍はありませんか?

386 :132人目の素数さん:2006/08/04(金) 21:03:17
経済分析のための統計的方法 第2版 (-)
岩田 暁一

ってどうすか?

387 :132人目の素数さん:2006/08/11(金) 10:52:56
国勢調査って回収率悪いから「補定という手法」を使って修正してる
んだって。

http://www.mhlw.go.jp/shingi/2006/06/txt/s0630-1.txt

これって信頼できるの?




388 :132人目の素数さん:2006/08/11(金) 20:02:00
WinBUGSのodcファイルをLinux上でテキストファイルに変換する方法はないですか?
WinBUGSを用意してodcファイルを読み込んでコピーしてテキストエディタにペースト
するしかないですか?

389 :132人目の素数さん:2006/08/11(金) 21:13:44
>>387
「有効回収率は85.7%」なんて言葉も出てくるね。
(夫婦関係の部分だけなんだろうけど)
こんなに低いなら適当な値で補う補定では相当誤差が出るだろうね。


390 :132人目の素数さん:2006/08/12(土) 11:23:59
anovaのための等分散性の検定について質問です。
2要因の場合、各要因別々に水準ごとの等分散性を検定するんでしょうか?
それとも、全要因同時に水準ごとの等分散性を検定するんでしょうか?

つまり、要因A(3水準)、要因B(2水準)として
A1 vs A2 vs A3 と B1 vs B2 を別々に行うのか?
A1B1 vs A2B1 vs A3B1 vs A1B2 vs A2B2 vs A3B2 を行うのか?
ということです。

ワタシは、後者だと思っています。
どなたか解る方いましたらよろしくお願いします。

391 :132人目の素数さん:2006/08/12(土) 20:58:13
>>389

ありがとうございます。
85.7%で相当の誤差がでるのですか。
国勢調査は項目ごとの未回答率を発表しないので
誰もどれぐらい補正されているか分からないのですが、
配偶関係とかは未記入が30%を超えているという噂が。
全数調査の意味があるのでしょうか?


392 :132人目の素数さん:2006/08/12(土) 21:00:37
国家の威信

393 :132人目の素数さん:2006/08/14(月) 17:35:43
>>391
補定はどれかに決めるみたいなので配偶関係だとたとえば
空欄なら「内縁」と決めるようなものです。(本当の補定で「内縁」
にしているかは知りません。念のため) 多くは当たるのかも
しれませんが、単に書き忘れた人もいるでしょうから数パーセントは
狂ってくるでしょう。たかが数パーセントと言っても人数にしたら
大きいので相当の誤差と表現しました。全数調査だから補定する
わけで普通の調査だと思って割合を推定し、それに基づいて全体の
人数を推定することも考えられるでしょうが、どちらの方が真の誤差が
小さいのかは分かりません。(配偶関係に限ると「内縁」だから書きたくない
という心理が働くなら調査された人数の比率を全体に拡大すると
今の補定よりも誤差が大きいかもしれません。項目によるのでしょうね。)

国の基本政策を決めるのには実際の人数というのが大変重要でしょうから
全数調査の意味はあると思います。未記入が多い項目について
単に補定がいいのかが問題なのでしょうね。


394 :132人目の素数さん:2006/08/17(木) 01:05:56
f(x,y) = ax(x-y) (0<x<2 , -x,y<x) それ以外は 0
と言う関数が確率密度関数になるような定数aは1/8で合ってますか?
全区間で重積分して1になるようにすればいいと思うんですが…

395 :132人目の素数さん:2006/08/17(木) 01:48:26
>>394
いいと思う。

396 :394:2006/08/17(木) 01:58:13
>>395
ありがとうございます。
この問題は選択式だったのですが、
1/8という選択肢がなかったため不安になって質問させていただきました。
問題作成が間違っていたということにします。

397 :132人目の素数さん:2006/08/17(木) 02:08:49
確率微分方程式について教えてください。
B(t)をwiener過程とすると、
∫[0,t]B(s)dB(s) = (1/2)・B(t)^2 - (1/2)・t
という計算を授業で教わったのですが、この考え方が分かりません。

計算方法のヒントとして習ったのは、
ΔB(t_k) = B(t_k+1) - B(t_k)とすると、上の計算は納k=0→n-1]B(t_k)ΔB(tk)の極限であるので、
韮(t_k)ΔB(tk)を計算すれば良いというふうに習いました。
この狽フ計算の極限であると言うのは分かるのですが、この計算からどうすれば答えに行きつくのかわかりません。
よろしくお願いします。

398 :132人目の素数さん:2006/08/17(木) 03:20:49
>>397
2韮(t_k)ΔB(tk) = 倍B(t_k+1)^2 - B(tk)^2} - 倍ΔB(t_k)}^2
と変形すると、右辺第一項は B(t)^2 となり
右辺第二項は t に2次の平均収束する。

399 :132人目の素数さん:2006/08/17(木) 04:34:44
統計を勉強したいのですがおすすめの本があったら紹介してください。一応講義は受けたことはあります。あとホーエルはあるていどは読みました。社会で数学を役立てたいと考えてます。そのため統計力学にも多少興味があります。

400 :397:2006/08/17(木) 13:47:47
>>398
理解できました。
ありがとうございました。

401 :132人目の素数さん:2006/08/17(木) 17:59:04
>>399
専門はなんですか?何に統計を使いたいんですか?それとも数理統計学をやりたいんですか?
統計力学をしたいのならば、ここでの統計は別物だと考えた方がいいので、物理板で聞いてください。

402 :132人目の素数さん:2006/08/19(土) 14:18:25
確率比例抽出法って、どういうサンプリング方法なんですか?
1 :こっち見んな:2006/08/19(土) 04:11:41
この調査の各都道府県における標本抽出の方法は,確率比例抽出法である。
高校 2820校 12万6900人
平成16 17歳 男170.8cm 女157.9cm
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
文部科学省  身長 昭和24〜平成16
http://www.mext.go.jp/b_menu/toukei/001/003/16/hyo.htm
女は、158cmしかないから、しょうがないね。
http://news20.2ch.net/test/read.cgi/news/1155928301/1

403 :132人目の素数さん:2006/08/20(日) 00:00:37
>>402
2つの県の高校生がそれぞれ50万人、100万人としたとき
500人と1000人調査するというように比例させる調査法じゃないかな?
その場合高校をどうやって選ぶのかは分からないけどね。


404 :132人目の素数さん:2006/08/20(日) 17:08:02
>>403
なるほど高校単位で抽出なのですね。元スレ>>402記事を見ると、
県別高校生身長って、北高南低なんですね。

405 :403:2006/08/20(日) 17:33:23
>>404
高校は選ぶだろうけど選んだ高校の全員を調べるというわけでは
ないだろう。ある県で500人調査という場合、10校選んでその高校から
50人ずつランダムに調査とかなのかが分からない。厳密には
各高校の人数は違うのでこの方法だと全体としてランダムとは
言えなくなるしな。


406 :132人目の素数さん:2006/08/20(日) 20:54:06
この統計の問題を教えてください。

2人の立候補者AとBが多数決式の選挙で争っている。
無作為標本での開票後、ある時点でAが51%でBが49%の得票率であったとする。
この時点で信頼係数95%でAの当選を予想するには合計で何票開票されている必要があるか?

という問題です。
正規分布を仮定することはわかるのですが、どのように求めるかの説明をいただきたいと思います。

407 :132人目の素数さん:2006/08/21(月) 11:25:49
テキストの問題なのですが、この問題の解き方を教えてください

母分散 σ^2=4 の正規母集団から大きさ n=5 の標本
9.75, 7.95, 12.80, 8.25, 9.86
を得た。母平均μの信頼係数95%の信頼区間を求めよ。

408 :132人目の素数さん:2006/08/21(月) 19:10:24
>>406
(0.51-0.50)/√{(0.51×0.49)/n} = 1.645 で n=6762票 かな?
違ってるかもしれないから誰か助けを求む。

>>407
あまりに基本的すぎる。
標本平均、正規分布、信頼係数のキーワードで自分で調べてた方がいい。

409 :132人目の素数さん:2006/08/21(月) 21:03:54
>>406
選挙に投票した人の数は?

410 :132人目の素数さん:2006/08/21(月) 21:27:11
>>409
投票した人数は十分に多いと予想して中心極限定理を用いるんじゃなかろうか。

411 :132人目の素数さん:2006/08/22(火) 14:40:58
>>408
Aの支持率をpとして、H0が p<=0.5、H1が p>0.5 とするんじゃないのかな。
本来は >>409 さんの指摘通り超幾何分布で投票数も問題になるけど、どう
せ大きいから二項分布で近似して、さらに正規分布で近似という流れ。

とはいえ、この問題の場合、得票率の有効数字が不明なんでホントは答え
ようがない。2桁だと本当の得票率が50.5%なのに51%と報告されてるかも
しれないとか考え出すと答えが決まらない。


412 :132人目の素数さん:2006/08/22(火) 16:49:53
>>406
必要な票数 n 、Aの得票数 X 、p=0.51 , q=1-p とおくと 
X 〜 N(np,npq) , (X-np)/√(npq) 〜 N(0,1)

P(X>0.5n) = P((X-np)/√(npq) > -(n/100)/√(npq)) = 0.95

-(n/100)/√(npq) = -1.645 とおくと>>408と同じく n=6762

413 :132人目の素数さん:2006/08/22(火) 17:23:47
えーと。求めるべきなのは、本当の支持率が 0.50(以下)なのに、
無作為抽出での支持率が 0.51以上になる確率が 0.05 以下になる
サイズだと思うんだけど。

なんで本当の支持率が 0.51 のときに無作為抽出での支持率が 0.50
以下になる確率が 0.05以下になるサイズを求めてるの?


414 :132人目の素数さん:2006/08/22(火) 17:37:26
>>407
E(X) =ΣXi/n = 9.72
s^2 = Σ(Xi-E(X))^2/(n-1) = 3.70

E(X)-2.78*(s/√n)≦μ≦E(X)+2.78*(s/√n)
9.72-2.39≦μ≦9.72+2.39

415 :132人目の素数さん:2006/08/23(水) 00:38:43
σ^2 が与えられているのに、その不偏推定値のs^2 を使うのは何故?

416 :132人目の素数さん:2006/08/23(水) 01:19:24
>>415
ホントだ。
統計学入門(東大出版会) 問題11.3 の答えも
>>414と同じになってるが間違いか。

E(X)-1,96*(σ/√n)≦μ≦E(X)+1.96*(σ/√n)
9.72-1.75≦μ≦9.72+1.75

417 :132人目の素数さん:2006/08/23(水) 02:18:16
統計学入門は章末問題の模範解答が間違ってると思われる箇所が結構ある気がする。
自分が間違ってるのかもしれないが…

>>406の問題は>>408>>412でOKだよね?
自分もそんな感じになると思うが。

418 :132人目の素数さん:2006/08/25(金) 22:41:10
>>416
信頼区間限界値=1.96*(σ/√n)即ち分布の95%点*標準誤差だが、何故
パーセント点と標準誤差の積が信頼限界とするのか積算の意味も
教えてもらえませんか。

419 :132人目の素数さん:2006/08/27(日) 07:15:37
素朴な疑問なんだけど
http://www.stat.go.jp/data/kokusei/2000/kekka
↑コレの結果見てたら
例えば
http://www.stat.go.jp/data/kokusei/2000/kihon1/01/zuhyou/a001.xls
http//www.stat.go.jp/data/kokusei/2000/jutsu1/01/zuhyou/k01a001_1.xlsの
人口が違うのはなんでなんだぜ??
人口=夜間人口(常住人口)じゃないのか??

420 :132人目の素数さん:2006/08/27(日) 09:40:13
>>419 統計でも数学と関係ないがな。ググると下の文書が出てきた。
下線が引いてあるけど、それとちゃうの。
http://www.toukei.metro.tokyo.jp/tyukanj/2000/tj-riyou.htm


421 :132人目の素数さん:2006/08/27(日) 10:01:58
>>420
スマソ…たまたま気になったモンでw
そしてdくす

422 :132人目の素数さん:2006/08/28(月) 18:33:57
ベイズ統計学で、直感的に易しく説明してある、入門書、啓蒙書があったらご紹介ください。
当方、ベイズの考え方になじめず、あまぞんで絶賛の渡部洋「ベイズ統計学入門」でも
難しさを感じてしまいます。

423 :132人目の素数さん:2006/08/28(月) 20:01:49
他スレでカキコしたんですが、こちらのほうがヒトが多そうなので。
何の知識もない門外漢ですが、書類上必要で・・・
Univariate logistic regression analysis
日本語訳教えてほしいんですけどぅ。。

424 :132人目の素数さん:2006/08/28(月) 22:00:56
単変量ロジスティック回帰分析

単語四つそのまま並べてググッてみるだけでもヒントは得られるよ

425 :132人目の素数さん:2006/08/28(月) 22:41:42
直訳だな。直訳だけど。

426 :132人目の素数さん:2006/08/28(月) 22:56:33
日本語で「単変量」をつけるのは見たことないな。
その書類って言うのが何か知らないけど単に
「ロジスティック回帰分析」でよいような。


427 :423:2006/08/29(火) 09:28:26
対比してMultiple logistic regression analysis も出てくるんです。
`単変量のロジスティック回帰分析'、`多変量のロジスティック回帰分析'
だったら普通でしょうか?

428 :132人目の素数さん:2006/08/29(火) 09:46:54
>>427
それを直訳するなら「多重ロジスティック回帰分析」ですね。
Univariateに対してMultipleというのは少々妙な気もしますが。

ググるとこんなん出てますね。
ttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc005/286.html

429 :132人目の素数さん:2006/08/30(水) 00:50:52
プロペンシティーマッチングの簡単な概要がわかる日本語の本とか論文しりまえせんかね?

430 :426:2006/08/31(木) 10:54:43
>>427
それなら「単ロジスティック回帰分析」と「多重ロジスティック回帰分析」かな。
428のいうように訳の釣り合いを考えると「単変量」に対応するのは「多変量」だが、
すでに「多重ロジスティック回帰」という言葉は定着しているからね。


431 :132人目の素数さん:2006/09/02(土) 17:40:10
四分位偏差についての質問です。
n=56で、下記のような度数分布表があります。
階級値42累積度数14
階級値37累積度数8
階級値32累積度数4
階級値27累積度数2
(階級値42より上は省略しました。)

第一四分位偏差を求めるのですが、テキストには
Q1=39.5+(14−8)/6×5=44.5
と書いてあります。が、どうしてこういう計算をするのか、意味がわかりません。
どなたか、わかりやすく説明して下さい。お願いします。
・゚・(ノД`)・゚・。

432 :132人目の素数さん:2006/09/02(土) 18:25:35
連レスごめんなさい。
標準偏差の計算式ですが、
S=√1/nΣ(xi−x)2
(2は二乗、√は全体にかかっています)
がどうして、
S=1/n√nΣxi2−(Σxi)2
(2は二乗、√は最後までかかっています)
になるのでしょうか?
親切な方、助けて下さい。
・゚・(ノД`)・゚・。

433 :132人目の素数さん:2006/09/02(土) 18:33:06
Σ(xi−x)2
=Σxi2−2xΣxi+nx2
=Σxi2−nx2
=Σxi2−1/n(Σxi)2

434 :132人目の素数さん:2006/09/02(土) 18:48:40
>>433
すいません、二行目から三行目への展開がよくわかりません…。
|∀;)

435 :132人目の素数さん:2006/09/02(土) 18:55:27
Σ(xi−x)2
=Σxi2−2xΣxi+nx2
=Σxi2−2/n(Σxi)2+1/n(Σxi)^2
=Σxi2−1/n(Σxi)2

436 :132人目の素数さん:2006/09/02(土) 19:26:33
>>435
わかった━━(・∀・)━━っ!!
ありがとう!!
・゚・(ノД`)・゚・。

437 :132人目の素数さん:2006/09/03(日) 01:56:08
GenStatという統計ソフトを貰ったんだけど、誰か使っている人いる?日本語で使い方説明している本やサイトがあったら教えてほしいんだけど。

438 :132人目の素数さん:2006/09/03(日) 13:54:07
グラフにRcumfって書いてあるんですけど、累積相対度数のことでしょうか?
何の略なんでしょう?

439 :132人目の素数さん:2006/09/03(日) 13:59:37
標準偏差の計算式なんですけど、
S=√1/nΣfi(xi−x)2
が、どうしたら
S=1/n√nΣfixi2−(Σfixi)2
(xは平均値、2は二乗です)
になるのでしょうか?
・゚・(ノД`)・゚・。

440 :132人目の素数さん:2006/09/03(日) 14:04:48
分散:V(X)=E(X^2)-(E(X))^2
(ただしE(X)はXの平均値、E(X^2)はX^2の平均値)
を証明して、両辺をルートでくくる。

441 :132人目の素数さん:2006/09/04(月) 13:03:35
>>440
ありがd
やってみまーすノシ

442 :132人目の素数さん:2006/09/04(月) 19:28:31
質問です。

正規分布の確率密度をN(m,s)としたときに、
対数尤度はl=Σ N(m,s)
と本に書いてあるのですが、尤度関数の計算に確率密度の値を入れても問題ないのですか?

尤度関数は条件付確率の積なので確率を入れるのなら分かるのですが…
対数尤度以外にも確率を当てはめる所に、確率密度関数が書いてある事が多いですが、
これは、密度関数ではなく確率を計算しろと言っているのでしょうか?




443 :信頼性:2006/09/05(火) 18:03:32
「truncated data」とはどのようなものなのでしょうか?
censored dataはわかるのですが・・・

英語の論文を読んでいるのですがどうしても理解できません。
よろしくお願いします。

444 :132人目の素数さん:2006/09/07(木) 16:35:01
Rupert G. Miller Jr.
Survival Analysis
Wiley
の最初読んだら?

445 :132人目の素数さん:2006/09/07(木) 23:14:24
テキストに、二つの集団の平均値が等しければ、標準偏差の小さいほうが高く評価されるって書いてあるんですけど、
これって、アホな人と賢い人の混ざった集団よりは、みんなが平均して普通レベルの集団のほうが評価が高いってこと?

446 :132人目の素数さん:2006/09/08(金) 01:23:17
どういう文脈なのか判らないが
ものすごく賢い奴がいてもあまり意味がなくて
困った奴がいるとものすごく困るという場合はそうだ。

447 :132人目の素数さん:2006/09/08(金) 12:19:01
まあそういうことじゃねえのか?
高く評価されるってのは扱いやすいってことだし

448 :132人目の素数さん:2006/09/08(金) 12:25:40
何らか製品作ることを考えれば誤差が少ないほうがいいだろうよ

449 :132人目の素数さん:2006/09/08(金) 15:19:16
質問させてください
「判別」と「分類」の定義とその相違を教えていただけませんでしょうか。
いまいちピンと来ないもので・・・
よろしくお願いいたします。

450 :132人目の素数さん:2006/09/08(金) 17:03:40
「統計」という言葉の使い方が知りたい。
実験データを分析して重力加速度が9.8m/sであることが分かったとする。
この実験データや重力加速度9.8m/sというのは「統計」と呼べるの?
わかりにくい質問ですまぬ。

451 :132人目の素数さん:2006/09/08(金) 21:18:01
>>446->>448
レスありがとうございます。
心理教育統計学のテキストなんですけど、データは、教え方を変えた二つの集団の、生徒のテストの点数です。
そこに「二つの集団の平均値が等しければ、標準偏差の小さいほうが高く評価される」って書いてあるんです。
なんか納得いかなくて…。
標準偏差が大きいのと小さいのとではどちらがいいかなんて、時と場合によりますよねぇ?
賢い子の伸びる可能性を無視しているように思えるのですが…。

452 :132人目の素数さん:2006/09/08(金) 21:21:02
>>450
鶏同士をたたかわせること。

453 :132人目の素数さん:2006/09/08(金) 22:44:06
>>451
>時と場合によりますよねぇ?
まあ書いた人もなんとなくで適当に書いたんだろうし
さらっと流せばいいんじゃないかと

454 :132人目の素数さん:2006/09/08(金) 23:57:00
平均と分散で決まるパラメーターの最大値が重要なら分散が大きいほうがいいかもな

455 :132人目の素数さん:2006/09/09(土) 00:07:03
体育の成績とか、結構そんな感じかもね。
一人でもインターハイ出場者が居たら、
平均は高いが皆凡庸ってのよりいいかもしれない。

456 :132人目の素数さん:2006/09/09(土) 00:23:40
>>451
強引に解釈を試みると、標準偏差が小さくなる教え方のほうが
集団なり教師なりの比較はしやすい、とは言える。
教え方として正しいかどうかは別問題。

457 :132人目の素数さん:2006/09/09(土) 14:23:01
>>451

統計学上の良し悪しと現実の良し悪しをごっちゃに考えている。
テキストの言うのは統計的な意味。標準偏差の小さい方が平均の精度がより高く、信頼できるということ。


458 :132人目の素数さん:2006/09/09(土) 16:18:12
「高く評価される」の「高く」の意味がわからない。
そのテキストの題名と該当箇所を添えて正確に引用してみては?

459 :132人目の素数さん:2006/09/09(土) 16:33:10
高く評価される ってのは よいことだとされる
ってことですよ。なんでいいことなの?っていわれたら>>457ってことだ

460 :132人目の素数さん:2006/09/09(土) 22:29:28
みなさん、レスいっぱいありがとうございます。
これは、並木博、渡辺恵子著『心理・教育統計学』1992という本です。
問題の部分の内容は

━━━━異なる教授法を用いた集団Aの中の生徒aと集団Bの中の生徒bは、テストで共に24点をとっているが、これを標準化すると
aについては0.32
bについては0.57
となり、bのほうがその集団内の平均値から離れている度合いが強く、集団B内では相対的に優れているということになります。
自明のことですが、同じ得点でも、集団の平均値が低ければそれだけ高く評価され、また、二つの集団の平均値が等しければ、標準偏差の小さい方が高く評価されます。━━━━

というものです。要約して書きましたが、後半の文章はそのまま書き出しました。
これを読み返していると、「高く評価」っていうのは、やはり、統計学的というよりも、教育学的見地から書かれたもののような気がしてスレ違いに思えてきました。
>>453のいうとおり、さらっと流したほうがいいのかもしれませんね。


統計学的に評価が高いというのは、部品の製造にについて統計をとった場合の精度などに言えることですよね?
あらゆるデータに適用して言えることではないですよね?

461 :132人目の素数さん:2006/09/10(日) 00:47:35
>>460
「(別の集団の2人が)同じ得点でも」というのを「(2つの集団が)同じ得点でも」
って誤読?

偏差値(T-score)や標準得点(z-score, standard score)の考え方を説明してある
くだりだよ。


462 :132人目の素数さん:2006/09/10(日) 01:11:15
>>461
誤読はしてないですよ。
単に偏差値等の考え方を示しただけなら、なぜ、標準偏差の小さいほうが高く評価されると書かれているのでしょう?
例えば、二つの大学で通学にかかる時間を調査して平均値が同じだった場合、標準偏差の小さいほうが高く評価されるなんてことはないはずですよね?

463 :132人目の素数さん:2006/09/10(日) 01:55:46
えーと。とりあえず一晩寝て冷静になることを勧める。

この例、つまり生徒a と生徒b について言ってることを一般にと誤解してるだ
けだって。でてる例だと、平均点より両方とも上でしょ。したら、分母の標準
偏差が小さい方が偏差値が上になる。それだけ。


464 :132人目の素数さん:2006/09/10(日) 02:23:04
その集団とかその統計が高く評価されるのかと思ったら
ある特定の点数をとった学生のことを書いてあったのか

平均50点のテストで80点をとった学生が居たときに
標準偏差が10点のとき(あ)と30点のとき(い)では、
(あ)のテストでの80点の方が価値が高いってことで、当たり前じゃんか
前者では3σの位置に居るのに後者ではσなんだから

465 :132人目の素数さん:2006/09/10(日) 04:11:13
>>461
もう一度転記しなおせ。本文をしっかりと理解していない人間に正しい要約ができるはずはない。

君が間違っている点を推測して書くと、ここで評価されているのは、各生徒の存在ではなく、各生徒が獲得した点数のことだ。
>同じ得点でも、集団の平均値が低ければそれだけ高く評価され、
これはいいな?

>二つの集団の平均値が等しければ、標準偏差の小さい方が高く評価されます。
あくまでも仮定は「違うグループに属する二人が共に同じ得点を獲得していて、かつ二つのグループの平均点が等しければ」だぞ?

二人の獲得した点数をT点、二つのグループの平均点をu点、二つのグループA、Bの標準偏差をそれぞれsa、sb(sa>sb)とおく。
グループAに属する生徒aの得点を標準化すると、
(T-u)/sa
同じくグループBに属する生徒bの得点を標準化すると、
(T-u)/sb
となる。
このとき、
(T-u)/sb>(T-u)/sa(なぜならsa>sbだから)
となるから、生徒Bの得点のほうが高い評価を受けることになる。

466 :132人目の素数さん:2006/09/10(日) 04:32:02
>>449
状況がわからないので何とも言えないが、多分その二つは同じ意味だと思う。
少なくとも日本語だと、統計学の言い回し?は同じ意味でも複数の表現がある。

>>450
例えも状況もあまり理解できないので何とも言えない。
だが基本的に何か普遍的な値を求めることを統計とは言わない。
でも何かのデータを分析した結果、重力加速度が9.8m/sという値が出てきたとかだったら呼べるかもしれない。
ただその9.8と求めたモデルに意味があるのか調べるために検定を行うとき、たとえそのモデルが有意であったとしても、その値が絶対に9.8でなければならないとは断定できない。

467 :132人目の素数さん:2006/09/10(日) 11:15:04
単にそう決めただけのこと
理由はデータの信頼度が高くなるから
それが統計学的視点であり、
実際の話題とずれることは大いにありうるというだけです。

468 :132人目の素数さん:2006/09/10(日) 16:03:51
465ので正解だろう。
こいつは文章をしっかり把握してない。
てか目に見えるものすら理解できないのに、目に見えない心理というものを理解できるのか。

469 :132人目の素数さん:2006/09/11(月) 05:56:39
かなり初心者です。
例えば日本人の人口から男女の比率を調べる為には人口の何%(サンプル数)を調べれば統計的に正確なデータが取れますか?

470 :132人目の素数さん:2006/09/11(月) 16:22:34
この25%とか1兆分の1とか45%って統計的に正しいの?

【電波】「電話しようと思っていたら電話がきた」現象に挑む英国の科学者、証拠を掴む
http://news19.2ch.net/test/read.cgi/newsplus/1157524492/

1 名前:(-◇-)コーホー@ひよこφ ★[sage] 投稿日:2006/09/06(水) 15:34:52 ID:???0 ?2BP(3)
 誰かに電話をしようと思ったすぐ後に、その人から電話がかかってくるという経験を
したことがある人は多い。英国の科学者が、こうした「テレフォン・テレパシー」の証拠を
掴んだと主張している。

 ルパート・シェルドレイク氏は5日、高名なケンブリッジ大学トリニティ・カレッジの支援を
受けた研究で、このような電話や電子メールを事前に予知する感覚の存在を証明する
実験を行ったと発表した。調査員たちは実験の参加者たちに、それぞれ4人の親類または
友人の名前を挙げるよう頼んだ。 次に、これらの親類や友人たちに実験参加者に
電話するようアトランダムに頼み、電話に出る前に誰からか推測させた。

 「正解率は45%でした。予想された確率の25%よりずっと上です」と、彼は英国科学
振興協会の年次総会で述べた。「これが偶然の産物である確率は1兆分の1です」
彼は、電子メールが届く前に誰からか当てる実験でも同様の結果が出たと述べた。

 しかしながら彼の実験サンプルは、電話が63名、電子メールが50人と、どちらも小さい。
実際に映像記録が残されているのは電話が4名、電子メールが5名だけというのも、
疑念を招いている。

 しかし、社会集団内の心の相関性を信じているシェルドレイク氏は、携帯メールでも
同様の現象がみられるかどうか、実験を続けるつもりだと語った。

http://www.excite.co.jp/News/odd/00081157515524.html

471 :132人目の素数さん:2006/09/11(月) 20:11:16
論文読まなきゃわかんない。

472 :132人目の素数さん:2006/09/11(月) 21:01:53
>>470
単純に合計の63名の実験でp=0.25の二項分布に従うものが
45%以上の結果を得る確率なら千分の1ぐらいで1兆分の1という
ことはない。なんかまゆつば?


473 :132人目の素数さん:2006/09/11(月) 21:05:49
考える気も起こらないほど曖昧すぎるなw

474 :132人目の素数さん:2006/09/11(月) 22:12:40
>>471
論文にすらならなかったから報告なんだろ?

475 :132人目の素数さん:2006/09/11(月) 22:14:47
これだけだとあれなので。

この人は真面目で有名な学者。
http://ja.wikipedia.org/wiki/%E3%82%B7%E3%82%A7%E3%83%AB%E3%83%89%E3%83%AC%E3%82%A4%E3%82%AF%E3%81%AE%E4%BB%AE%E8%AA%AC
なお、シェルドレイクは生化学において博士号を取得した英国王立協会会員である。
また、アメリカのPBSテレビは「現在もっとも注目すべき6人の科学者」の1人に挙げた。

476 :132人目の素数さん:2006/09/11(月) 22:54:13
そのうちの1人が池田大作だそうだ

477 :132人目の素数さん:2006/09/11(月) 23:35:23
>>476
ソースは?

478 :132人目の素数さん:2006/09/12(火) 07:34:34
シェルドレイク終わったな
エイプリルフールにでもやればよかったのに

479 :472:2006/09/12(火) 20:38:55
論文は
http://www.sheldrake.org/papers/Telepathy/exptests_abs.html
のようだ。一人当たりの実験が多かったようで先の確率計算とは違った。
電話をかけてもらう対象者をどの程度ランダムに選んだかがまず
問題だな。英語が達者な人がいたらその点が書かれているか
教えてくれ。


480 :132人目の素数さん:2006/09/12(火) 22:00:12
本当にランダムだったのかが怪しいのと、
現実の状況から実験内容がやや離れすぎじゃないかと思った

481 :132人目の素数さん:2006/09/12(火) 22:05:45
なんか実験者の思い込みとかが混じってる可能性大だよね

482 :132人目の素数さん:2006/09/13(水) 18:01:00
>>475はわざとかしらんが
まじめな学者と言いつつリンク先には「疑似科学」とかかれている

483 :132人目の素数さん:2006/09/13(水) 20:08:05
こいつ形態形成場の人でしょ?
いわゆる正規の科学者から結構叩かれている。
海外のトンデモ科学批判の代表例として本に記載されるほど。

484 :132人目の素数さん:2006/09/14(木) 14:48:58
相関係数と回帰分析の検定について教えてください。

今、標本xとyについて、相関係数がr=0.94 回帰式がy=2.2x+2.2と結果が出ました。
母集団は、Yの平均6.9、Yの分散178になりました。

このとき、相関係数と回帰分析の検定を求める式(できれば結果も)を教えてください。
有意水準は0.05でお願いします。

485 :484:2006/09/14(木) 14:57:35
書き忘れましたが、
標本(x,y)はn=101、母集団(Y)はN=438
です。

486 :132人目の素数さん:2006/09/15(金) 05:28:54
>>469の答えは?

487 :132人目の素数さん:2006/09/15(金) 07:53:08
>>469
日本人の男女の比率は公表されているので無意味。

488 :132人目の素数さん:2006/09/15(金) 16:06:47
サンプルを無作為にとるのであれば
たくさんとればとるほど正確

489 :132人目の素数さん:2006/09/15(金) 16:07:18
つうか5%くらいしか違わないから50人とか10人ですますわけにはいかんだろうな

490 :132人目の素数さん:2006/09/15(金) 21:00:31
非常にしょうもない質問で本当に申し訳ないのですが
X%の確率で起こる事柄がある時、
何回ほど試行すれば統計学的に信用のおけるXの値が得られるのかを教えていただけないでしょうか。
分かりにくい文章ですがどうかよろしくお願い致します。

491 :132人目の素数さん:2006/09/15(金) 21:26:10
統計学的に信用できる、という表現からして
誤解している。>>469が放置されてるのもそのせい。

492 :132人目の素数さん:2006/09/15(金) 21:33:17
統計学的には、何人からが信頼できて何人からが信頼できない、
とかそういう線はないでしょ
5%とか1%を一応「滅多にないこと」の基準にするけど
これはきりが良さそうな数字を適当にとってるだけで
実際薬の副作用とかで100人に5人死んじゃったら困るわけで

「わかりやすい統計学」とか読んでみたら?

493 :132人目の素数さん:2006/09/15(金) 21:40:44
なるほど…。
ではみなさんが最低でもこれぐらいの回数は調べるべきだろう、
と思う回数を教えていただけないでしょうか。

494 :132人目の素数さん:2006/09/15(金) 21:50:55
慣例として社会科学とかは5%、
精密機械とかなら0.1%とかそれ以下でやるべきなんじゃねえの?

495 :132人目の素数さん:2006/09/15(金) 21:56:47
何の0.1%や5%なのかがよく分からないです…。
そこまで教えていただけると非常にありがたいのですが…。

496 :132人目の素数さん:2006/09/17(日) 10:18:39
上で言われてるのは有意水準だろう
サンプルサイズと誤差の関係を勉強し直すべし

497 :132人目の素数さん:2006/09/17(日) 12:07:09
社会調査と標本サイズに関してこんなページを見つけた。

http://www.nikkei-r.co.jp/nikkeipoll/06research1.htm


498 :132人目の素数さん:2006/09/20(水) 12:01:38
質問させてください
確率変数Xの母集団分布という表現はおかしいでしょうか?

499 :132人目の素数さん:2006/09/20(水) 14:02:44

時系列分析を勉強したいです。
単位根検定の理解からはじめて、エングルグランジャーの検定やヨハンセンの検定を集中的に勉強したいです。
それらについて分かりやすく解説している参考書などがありましたら教えてください。


500 :132人目の素数さん:2006/09/20(水) 14:38:46
質問させて下さい。
推定量の漸近相対効率とは、推定量の漸近分散の比でいいんでしょうか?
あと、漸近相対効率について詳しく書いてある本をご存知の方がおられましたら
ご紹介いただけませんでしょうか。
よろしくお願いいたします。

501 :132人目の素数さん:2006/09/21(木) 01:36:06
オカ板から来ますた。
用語について教えてください。
『パーセンタイル値』ってわかりやすく言うと
どういうことでしょうか?
ネットで調べてみたのですが、低い方から何番目か、
ということでいいのでしょうか?
例えば、『5%タイル値』というと、100人いたら
低い方から5番目にあたる、という解釈でいいですか?
よろしくお願いいたします。

502 :132人目の素数さん:2006/09/21(木) 09:00:12
>>501
100人分のデータがあったら5パーセンタイル値は低い方から
5番目の値というので合ってますよ。
(%ileとなるので%タイルは変ですが。)
高い方から5番目の値なら95パーセンタイル値です。


503 :132人目の素数さん:2006/09/21(木) 20:01:33
わざわざオカ板から来たと宣言する狙いは何なのだろう。
心霊現象の統計でも取っているのだろうか。

504 :132人目の素数さん:2006/09/21(木) 21:07:56
501です。

>>502さん
丁寧な説明、ありがとうございました。
高い方からの説明もつけていただいて助かりました。
大変わかりやすく、一発で解決しました。
本当にありがとうございます。

>>503さん
いや、オカ板は関係ないのですが、チーム2ちゃん
ということで。オカ板に常駐しているものですから。
仕事で、ある検査をして、そのデータ(結果)がどのパーセンタイル
に属するか別表があるのですが、パーセンタイルの
意味がわからなかったのです。

505 :132人目の素数さん:2006/09/23(土) 13:29:14
http://www.crear-ac.co.jp/sogo/BW_Upload/tokei_mondai.pdf

正直なところこの統計学の試験問題は難しいのでしょうか。
自分は第18問問題1が難しいのですが。
ちなみに、これは会計士試験です。

506 :132人目の素数さん:2006/09/23(土) 21:27:10
>>505
会計士も大変やな。統計の問題としてはそれほど難しくはないが
証明を含むこれらの問題が会計士に必要なのかと思ってしまうな。
(1)とかは知っておいてほしい性質やけどな。
(もしすべての会計士がこの問題が解けるのならもっと中央値を
示せよって思ってしまう。w)


507 :132人目の素数さん:2006/09/23(土) 23:42:49
「有意」って言葉の意味や使い方が,いまいちわからないんだけど
有意である=確率が極めて低い
でいいのかな??

508 :132人目の素数さん:2006/09/24(日) 01:43:31
そうだよ。帰無仮説を仮定したときそのデータが得られる確率が低いなら
帰無仮説は棄却される。普通、検定では棄却を目的としているのでそれは
「意味の有ること」ということだよ。


509 :132人目の素数さん:2006/09/24(日) 01:48:25
>>508
レスありがとうございます。理解できました。

510 :132人目の素数さん:2006/09/26(火) 00:39:23
会計士って統計学必要なことすら知らなかった。
会計士用の統計学教科書みたいなのって存在するのか?


511 :132人目の素数さん:2006/09/26(火) 17:48:57
まあ選択科目の一つとして、だけどね。

512 :132人目の素数さん:2006/09/26(火) 23:35:18
独立変数ABCがあるとしてAB間に相関があると,GLMでstep()でモデル選択をする場合,
フルモデルからスタートするのか,ABのいずれかを決定したうえでモデル選択をすべきか
どちらが正しいのでしょうか?

513 :132人目の素数さん:2006/09/28(木) 02:40:18
どなたか教えてください。
工場の作業工程中に、ある機械Xを用いたところ、下記のようなトラブルの現象・増加が認められた。
この機械Xの有用性もしくは有効でないことを証明するための検定方法は何を使えばいいのでしょうか?
個々に検定を行うのではなくまとめてやる方法はあるのでしょうか?

トラブルA 3 → 1
トラブルB 2 → 1
トラブルC 2 → 1
トラブルD 3 → 1
トラブルE 2 → 1
トラブルF 2 → 0
トラブルG 1 → 2(増加)
トラブルH 0 → 1(増加)


長文で申し訳ありませんがよろしくお願いいたします。

514 :132人目の素数さん:2006/09/29(金) 09:51:53
>>513
全部まとめると15→8ですか。
15を真の平均としたポワソン分布なら片側でぎりぎり棄却できる。
しかし、増加もありうるなら両側で検定すべきで棄却は無理ですね。
実際には以前のデータはもっとあるはずで分布の推定をよくしないと
信頼性がありませんが。


515 :132人目の素数さん:2006/09/30(土) 23:58:04
>>514
ありがとうございます。
やはりデータ少なすぎですか。
どうにかして有効である事を示したかったのですが、もう少し頑張ってみます。

516 :132人目の素数さん:2006/10/01(日) 01:34:54
>>502
>5パーセンタイル値は低い方から5番目の値・・・
パーセンタイル値とパーセントランク値は、どのように違うのですか?

517 :132人目の素数さん:2006/10/01(日) 02:20:21
>>516
パーセントランクはデータに対する百分位数のようですね。
そうするとパーセントランク値は対応するデータが存在する所でしか
考えないという意味でパーセンタイル値とは違うとも取れますが、
あまり区別して使っていない人も見られますから、同じと考えても
よいのかもしれません。

518 :132人目の素数さん:2006/10/01(日) 16:26:52
ききたい

ある集合が正規分布にしたがっているとする
そのときそれから幾つか標本値をとりだし
その標本値を x1=< x2=< ....=< xn
のように並べ
縦軸をy=i/(n+1) (i はxの添え字と同じ数字)
累積標準正規分布関数の逆関数を f とし
 f(y(i))から

(x1, f(y(1)), (x2、f(y(2)).......
とするとこの関係は直線になるらしい
でもこのx、yの対応関係はおかしい
他に厳密なものがあるはず

519 :132人目の素数さん:2006/10/01(日) 18:29:16
大学の選択科目で統計学を取るか迷ってるんですが、
数学が苦手な人間はとらないほうが良いですか?

520 :132人目の素数さん:2006/10/01(日) 19:52:05
>>518
どうしておかしいと思うのか?


521 :132人目の素数さん:2006/10/01(日) 20:01:48
>>519
基本:単位がよほどギリギリでない限り登録しておいて気に入らなければやめる
発展:将来のゼミ選択まで考えて必要性を吟味


522 :132人目の素数さん:2006/10/01(日) 20:44:58
>>521 うちの学校登録してしまうと途中でやめることできないんです。
仮に選択して、成績悪かったら全体の成績にも響くし…

523 :132人目の素数さん:2006/10/01(日) 20:51:38
あまり数学が得意じゃなくてもいいんじゃないのかな。
教養で習う統計なんだから、積分とかだって面積のことだ、くらいに思っとけば大して問題ない。
公式もそうあるわけじゃないから、いざとなりゃ、
統計学の本質とは関係ないと思って覚えてしまっても良いし。

ただ確率とか組み合わせの問題に関するある程度の常識的感覚は必要だと思う。

524 :132人目の素数さん:2006/10/01(日) 21:02:47
中高レベルの確率の知識はあったほうがいい。
微積分の知識はあったほうがいいが、無理しなくてもいいかな。
基礎レベルならまず線形の知識は必要ない。
まあ担当教員に聞くといいと思う。

525 :132人目の素数さん:2006/10/01(日) 23:06:01
>>523>>524
確率は苦手意識があるんですよね…
高校の時みっちりやったので、出来ない訳ではないと思うんですが

担当者や周りの人にも聞いてみようと思います。
ありがとうございました!

526 :518:2006/10/01(日) 23:51:12
>>520
xi の位置から対応するシグマ換算の値と、
f(y(i))の値が厳密に対応してないじゃん

仮に標本1万個とったとして
1万番目のxが
f(y(10000))の位置にくるなんてどうして言える?

527 :132人目の素数さん:2006/10/02(月) 01:06:47
>>526
厳密にというのは E(x10000)=f(y(10000)) ではないという意味だね?
(期待値を取らずに一致しないのは当たり前だからね。)
それではなぜ厳密にしないのかというとそのためにはデータ数ごとの
膨大な計算が必要になってその苦労の割に益が少ないというのが理由であろう。


528 :526:2006/10/02(月) 01:21:21
>>527
そういうこと

f(y(i))ではない
ほかのY値の取り方が幾つかあるらしい
それを教えてほしい

上の例ではあまりに大雑把すぎる

529 :132人目の素数さん:2006/10/02(月) 09:33:40
>>528
y=(i+1/2)/nとか色々あるのだろうけど結局どれも適当な近似にしかすぎないと思う。
2次以上の式を作ろうとすると分布に依存して困るのだろうな。
正規分布専用に作られた式があるのかもしれんが、見たことないな。



530 :529:2006/10/02(月) 09:40:43
ここに少し書いてある。
http://www.geocities.jp/ikuro_kotaro/koramu/278_max.htm
y=i/(n+1)が正当化されるのは一様分布のときだけですね。
正規分布に関しては最大値(最小値)の分布についてしか書かれてません。
誰か計算していないのかな。


531 :132人目の素数さん:2006/10/02(月) 22:57:52
期待値の演算についての性質で
E(X+Y)2乗=E(X2乗)+2E(XY)+(Y2乗)
とあるのですが、なぜ最後の(Y2乗)の前にEはつかないのですか?

532 :132人目の素数さん:2006/10/02(月) 23:02:32
>>531
つくよ。誤植だね。

533 :132人目の素数さん:2006/10/03(火) 11:12:26
d(XY) = XdY + YdX + dXdY
の最後の項を経済学で交絡項というらしいんだが、
これって一般的な統計用語??


534 :中川泰秀 ◆tyvkWCNtzY :2006/10/03(火) 12:25:12
統計学に関しては、数学コースと経済学部とではどう違うの  ?

数学コースの統計学
経済学科の統計学

その違いを教えてや。

535 :132人目の素数さん:2006/10/03(火) 13:10:38
クロスタームのこと?

536 :132人目の素数さん:2006/10/03(火) 20:53:41
>>532
誤植なのですか?
後のほうのページで
σ2乗=E(X−μ)2乗=E(X2乗)−2E(X)μ+μ2乗
とあり、やはり最後の項だけEがついていないのですが…。
どうして上のような式になるのでしょう?

537 :132人目の素数さん:2006/10/03(火) 20:57:38
>>536
μは定数なので期待値を取っても変わらないだけなのだが…


538 :132人目の素数さん:2006/10/03(火) 21:36:23
んじゃ、>>531は誤植、
>>536は定数だから
ということでよいのですね?

539 :132人目の素数さん:2006/10/03(火) 22:13:37
そゆこと。


540 :132人目の素数さん:2006/10/03(火) 22:17:42
わかりましたぁ〜。ノシ
ありがd

541 :132人目の素数さん:2006/10/04(水) 13:33:42
質問させてください
Xが正規分布N(u,s^2)に従うとき、logXの期待値って求まりますか?
求めている論文とか本とかないですかね?

542 :541:2006/10/04(水) 17:41:20
すみません、0含んでるから無理ですね・・・
お騒がせしました

543 :132人目の素数さん:2006/10/06(金) 23:32:30
教えてください。
https://www.pref.kumamoto.jp/statistics/siryo/report/data/002/002-03.pdf#search=%22%E5%9B%BD%E5%8B%A2%E8%AA%BF%E6%9F%BB%E3%80%80%E6%8A%BD%E5%87%BA%E9%80%9F%E5%A0%B1%E9%9B%86%E8%A8%88%E7%B5%90%E6%9E%9C%E3%80%80%E7%B2%BE%E5%BA%A6%22
ここにH12年国勢調査の1%抽出速報の精度に関しての考察があるのですが、
「推定値の標本誤差」と計算方法を示しているにも関わらず、
その計算式を実際の調査に使って評価をすることはせず、いきなり、
「誤差率は5%未満の範囲にあり、抽出速報の集計精度は高いといえる。」
と無茶苦茶な結論を出しているのですが、どう考えても変です。
誤差を絶対値で書いているのも、怪しいです。
誤差率は5%未満だったら、母数の大きさとか、抽出率とかに関係なく
精度は良いのでしょうか?


544 :132人目の素数さん:2006/10/07(土) 23:46:47
>>543
「しかしながら、抽出集計はあくまで推計であるため、集計項目が細かくなれ
ばなるほど、誤差は概ね大きくなる傾向は否定できない。このため、全国や都
道府県別の大まかな傾向を把握するには十分な資料ではあるが、抽出集計であ
るため、市町村別データ等の提供は困難となる。」
と書いてあるから別にいいんでないか。

まあ誤差率で把握するので十分かはどう使うかによるだろうね。
その人数を根拠に予算を組むとかなると同じ1%でも千人と十万人では
えらい違いやからな。


545 :132人目の素数さん:2006/10/08(日) 00:03:58
別に母数から推計される誤差率に比べて
H12年の1%抽出速報は「偶然」抽出速報の精度が高かったとか、
あるいは別の回では「偶然」低かったとか
母数と比較して相対的にどうか、とかそういうことではなくて、

単純に5%で実際の値(に極めて近い国勢調査の値)
を予測できるのはよいことだ、くらいで言ってるんじゃないかな。

546 :132人目の素数さん:2006/10/08(日) 00:37:25
統計学を
網羅的に学べる本を教えてほしい
できるだけ厳密に証明などがあるものがいい

自分の現在の知識は・・・
東大出版の自然科学の統計学の本の数式は普通に追える(半分ほどよんだ)
ルベーグ積分の知識はない(時間的に勉強はむり)

これを踏まえたうえでなるべく厳密、網羅的なものがほしい

547 :132人目の素数さん:2006/10/08(日) 00:40:23
「数理統計学」とか名前の付いた本が良さげ?
それとも応用嗜好?

548 :546:2006/10/08(日) 00:49:22
>>547
どっちもおしえて!
ただ一番嫌いなのは中途半端な厳密さで書いてある本
これに該当するものは除外してほしい

549 :546:2006/10/08(日) 01:04:25
>>548
中途半端な厳密さとはなにか・・・

例としては、2変数の変数変換でついてくるヤコビ行列式を
面積の伸縮率なんかで説明しようとする(とある本)
かつ、それが主なやりかたで説明が続いていくとか・・・

550 :132人目の素数さん:2006/10/08(日) 02:22:59
Show that if a randam variable is discrete and takes on countably infinite number of distinct values ,
then each value cannot have same probabilitly .

これ大学院の宿題なんですけど、どなたか教えてください!><
さっぱり分からなくて。。

551 :132人目の素数さん:2006/10/08(日) 03:02:38
>>550
each...not...って完全否定だっけ?もし全ての確率が同じだとすると、
全部足したときに∞になってしまう、ということでは?
・・・全然違うかも

552 :マハラノビス:2006/10/08(日) 14:47:36
>550
 それは簡単。
 有界な範囲の数値でしょ?
 同じ確率になるわけがない。
 すぐ証明できますよ。

 大学院の宿題って、数学科以外の修士には
 ちょっと難しいかも?

 ただ応用数学で統計やっているなら
 そのぐらいすぐできないとだめでちゅよー!


553 :132人目の素数さん:2006/10/08(日) 14:48:51
社会系の大学院とかかもしれないけど
これくらい分からんと確率が分かってるとは言えないよね

554 :マハラノビス:2006/10/08(日) 14:49:42
訂正 有界ー>加算


555 :132人目の素数さん:2006/10/08(日) 16:46:11
95%信頼区間についての質問です。
P{x~−1.96σ/√n<μ<x~+1.96σ/√n=0.95
(ただしx~はエックスバー、<の下には=がつきます)
テキストに、「上の式でμの上限と下限が決まる」「標本ごとに上の式で上限と下限を求めると、その区間の中にμを含む場合も含まない場合もあり、μを含むのは全体の95%。」と書いてあるのですが、全く意味がわかりません。
・゚・(ノД`)・゚・。
式中のμって何ですか?標本平均ですか?それともサンプリング分布の平均ですか?

556 :546:2006/10/08(日) 17:12:35
まだ???

557 :555:2006/10/08(日) 18:09:28
自己解決しました〜。(・∀・)ノ

558 :550:2006/10/08(日) 20:37:48
>>551

完全否定ですね。
違う確率だったら足し合わせても∞にならないんすか?

>>552

もうちょっと詳しくおねがいしまっ!!><
社会学系の大学院です◎


559 :132人目の素数さん:2006/10/08(日) 20:51:30
each value cannot have same probabilitly .を、「全ての値に対する確率は全て異なる」と
解釈すると簡単に反例作れると思うが?例えば値1、2、3・・・を取る変数に対して
その確率が1/2、1/8、1/8、1/16、1/16、・・・であるとして
何の問題も起きないのでは?

560 :132人目の素数さん:2006/10/08(日) 20:55:39
Show that だから作れないように解釈するのが正しいんじゃないかと、、

each two valueだったらそう解釈するのが自然なんだろうかな
probabilitlyはprobabilityのtypoだろうね

561 :132人目の素数さん:2006/10/08(日) 20:57:37
>>549
>例としては、2変数の変数変換でついてくるヤコビ行列式を
>面積の伸縮率なんかで説明しようとする(とある本)
>かつ、それが主なやりかたで説明が続いていくとか・・・

「とある本」のタイトル教えてw


562 :550:2006/10/08(日) 21:07:15
>>559

あ、たしかに!
分かりました!!◎◎◎

>>560

はい。probabilityです!

563 :546:2006/10/08(日) 22:39:09
で、おしえてくれる気あるの?ないの?

564 :132人目の素数さん:2006/10/08(日) 23:30:07
>>550
まず完全な訳を考えると
「確率変数が離散的であり可算無限の異なった値を取り得るなら、
全ての値が同じ確率を持つことはできないことを示しなさい。」
ということでOK?そうなら>>551などが答だね。


565 :132人目の素数さん:2006/10/09(月) 00:28:42
2つの異なる多変量正規分布から発生する確率変数をそれぞれX,Yとして、
この2つの和の分布p(X+Y)がどうなるかを調べる方法を
教えて欲しいのですが。

566 :551:2006/10/09(月) 00:42:23
>>558
混同してたけど、完全否定じゃなくて部分否定だよね?
部分否定「全ての確率が同じ、というわけではない」なら>>551で良いはず。
完全否定「全ての確率はどれも異なる」だと>>559が反例になってしまう。

567 :132人目の素数さん:2006/10/09(月) 01:38:50
そんなに考え込むほどの英文じゃないだろ
>>564でFA

568 :132人目の素数さん:2006/10/09(月) 11:44:19
>>546 ルベーグ積分を知らない、っていいながら「とある本」みたいなのは
いらない、って言ってるので皆どうしたもんか、と悩んでいるんじゃない?
しかも要求からすると、やさしい統計学、みたいな感じのものじゃ駄目みたいだし。

569 :132人目の素数さん:2006/10/09(月) 19:54:38
統計学の宿題の問題がわかりません。誰か教えてください。

ある場所からある場所までの徒歩での所要時間を6回計測したものがある。次の信頼区間を推定しなさい。
ただし、 μは母平均、 σ二乗(←変換できませんでした)は母分散をあらわすものとする。(小数点第4位で四捨五入)

データ 14.5 15 13.5 14.5 15.5 17

@危険率5%での母平均の信頼区間を推定しなさい。
A危険率1%での母平均の信頼区間を推定しなさい。
B危険率5%での母分散の信頼区間を推定しなさい。
C危険率1%での母分散の信頼区間を推定しなさい。

さっぱり分かりません。
詳しく教えてください。

570 :132人目の素数さん:2006/10/13(金) 17:00:15
質問させてください
Fisher情報行列の対角部分って必ず正になりますか?
よろしくお願いします

571 :132人目の素数さん:2006/10/14(土) 02:02:09
>>569
母平均の信頼区間を推定する時はその時の帰無仮説を
同様に母分散の信頼区間を推定する時にも帰無仮説を示してくれないと…

572 :132人目の素数さん:2006/10/14(土) 18:55:23
よろしくお願いします。

64面あるサイコロがあるとします。64回振れば理論上1〜64までの数字が出そろう
わけですが、実際は同じ数が何回もでたりある数は全くでなかったりします。

64回のうち、同じ数が何回まで出るのが誤差の範囲と言えますか?


573 :132人目の素数さん:2006/10/14(土) 19:00:21
>>64回振れば理論上1〜64までの数字が出そろう


574 :572:2006/10/14(土) 19:16:07
>>573
ちがうんですか?

575 :572:2006/10/14(土) 19:19:36
変なら訂正します。

64面あるサイコロがあるとします。それぞれの数が出る確率は1/64で、
64回振れば理論上1〜64までの数字が出そろうわけですが、
実際にふると同じ数が何回もでたりある数は全くでなかったりします。

64回のうち、同じ数が何回まで出るのが誤差の範囲と言えますか?

576 :132人目の素数さん:2006/10/14(土) 19:21:17
64回振れば平均的には1〜64までの数字が1回ずつ出るってことでしょうね。
あと誤差という言葉もちょっと誤用してるような。
表現は正確に。

計算で求めることが出来るのは、
2回同じ数が出る確率がいくら、5回以上同じ数が出る確率がいくら。
とかそういう確率だけ。

それで、これは起きる確率が1%以下だから、確率の低い事象が偶然起きたと考えるよりは
元のサイコロがおかしいと考えるべきなんじゃないか、とか考えたりするんだけど
そのとき何%を取ればよい、というのは、統計的に何%が妥当、とかそういうことは言えない。

577 :572:2006/10/14(土) 19:39:53
>>576
ありがとうございました。

578 :572:2006/10/14(土) 19:41:37
>>576
ありがとうございました。
半分すっきりしました。
後半分は漏れの脳では、いくら経ってもすっきりしないと思いますのでw

579 :132人目の素数さん:2006/10/14(土) 21:26:30
x1,x2,...xn が独立で同じ正規分布に従うと
する
そのとき
y1=a11x1+.....+a1nxn
.....
yn=an1x1+......+annxn
とし
cov(yi, yj)=0
となるとき
yiはそれぞれ独立なのか
証明はどうできるのか

580 :132人目の素数さん:2006/10/15(日) 02:07:55
株式指数に関する時系列データを探しています。
日経平均やTOPIX、個別銘柄に関しては入手できたのですが、
コア30や、TOPIXの大型株などの日次データは入手できますかね?


581 :132人目の素数さん:2006/10/15(日) 02:44:12
>>580
意味判らん
yahooとかtechnobahnじゃあかんの??
http://www.technobahn.com/cgi-bin/fn/plot?sid=&q=t&c=1013&lang=

582 :132人目の素数さん:2006/10/15(日) 02:45:49
>>579
i≠j
cov(yi,yj)
=cov(Σ[k=1,n]aik*xk,Σ[l=1,n]ajl*xl)
=Σ[k=1,n]Σ[l=1,n]aik*ajl*cov(xk,xl)
=Σ[k=1,n]aik*ajk*cov(xk,xk)
=Σ[k=1,n]aik*ajk*σ^2

583 :132人目の素数さん:2006/10/15(日) 03:17:10
>>581
ありがとうございます。
yahooやtechnobahnでは業種別株価指数だとかTOPIXcore30といった
インデックスの過去のデータはなくて・・・


584 :132人目の素数さん:2006/10/15(日) 04:14:10
そういうことって株板とかで聞いたほうがいいんじゃないの?

585 :132人目の素数さん:2006/10/15(日) 07:58:03
Cauchy分布に従うiid列が大数の法則を満たさないことの証明って
ある?

586 :132人目の素数さん:2006/10/15(日) 09:53:10
分散が有界でないことから証明できるのでは?

587 :579:2006/10/15(日) 10:19:57
>>582
???
なにを言おうとしているの???
それで独立だとなぜいえるの???

588 :132人目の素数さん:2006/10/15(日) 20:03:53
>>587
勘違いしたんだろう。

(X,Y)が2次元正規分布に従う場合、
「X,Yの相関係数が0である」

「X,Yが独立である」
は同値だから、が答だろうね。


589 :132人目の素数さん:2006/10/16(月) 03:01:20
統計学を学ぶ上での
良いバイブルを教えてください
統計学入門(東京大学出版会)は読みました。

590 :132人目の素数さん:2006/10/16(月) 17:00:57
モデルのパラメータ数が増えると、推定量の漸近分散が
大きくなるという傾向はあるんでしょうか
包含するパラメータ数の違うモデルに基づく推定量の
漸近相対効率はあまり意味が無いといったことはありますか?
よろしくお願いいたします

591 :132人目の素数さん:2006/10/18(水) 21:04:45
時系列データを処理しています。

ある時系列データが平均回帰過程であるか否かを
示すにはどういう指標を計算したらいいでしょうか?
または、何か検定のようなものが可能でしょうか。

592 :132人目の素数さん:2006/10/18(水) 22:26:43
最尤分散と不偏分散の意味がわかりません。
後者はnではなくn-1で割ってますが、これはデータが大きくなるにつれてnでわる最尤分散では
誤差が大きくなる。そのため、n-1で割るということでしょうか?

593 :589:2006/10/19(木) 00:15:32
>>592
統計学はあまりよくしらない超初心者だが
こたえてやろう

一般に最尤分散は不偏分散ではない
しかしnが大きくなるにつれて
最尤分散は不偏分散へとなっていく
これはn-1とnが大きいところでは同じものだと
みなせることからわかるはず。

しかし良い点が最尤分散にはある
それは最尤分散の分散が最小となることなんだよ!!!
これは普通の不偏分散にはない点!
わかったか?

594 :132人目の素数さん:2006/10/19(木) 21:05:24
平成17年国勢調査 第6表より 
東京都港区 男性配偶関係 

年齢   未婚率   不詳率
25    94.3%     0.0%
26    89.9%     0.0%
27    88.3%     0.0%
28    83.9%     0.0%
29    76.6%     0.1%
30    72.0%     0.2%
31    70.2%     0.1%
32    63.5%     0.3%
33    60.9%     0.2%
34    58.4%     0.4%   ← 注目
35    21.4%     33.0%   ← 注目
36    22.2%     30.3%
37    18.3%     31.1%
38    20.1%     30.2%
39    18.2%     27.3%
40    17.1%    27.2%


595 :132人目の素数さん:2006/10/19(木) 22:19:53
多変量正規分布の密度関数を分散共分散行列でΣ^(-1)で偏微分するときに、
Σ^(-1)の成分σijとσjiは同じ変数として扱うべきか、違う変数として扱うべきか悩んでいます。

これはどのように扱えばいいのでしょうか?

596 :132人目の素数さん:2006/10/20(金) 11:27:43
心優しいい方教えてください。
多数のグラフから関連性を調べるにはどうしたらよいでしょうか?

597 :132人目の素数さん:2006/10/20(金) 12:19:06
統計学の教科書を読む。

598 :中川泰秀 ◆tyvkWCNtzY :2006/10/20(金) 12:45:37
http://ccpc01.cc.kindai.ac.jp/in/INDEX.HTM

で ならえばいい。

599 :132人目の素数さん:2006/10/20(金) 21:28:43
>595
要素ごとにとり扱うんじゃなくて
行列微分すりゃ一発でしょ
逆行列の微分なんてMatrix differentiation関連の本見りゃ
載ってるよ

600 :132人目の素数さん:2006/10/20(金) 21:47:31
mathmaticaでもできたかな

601 :132人目の素数さん:2006/10/24(火) 21:00:39
カルバックライブラー情報量は、
他の情報量と比べて何が違って
何が優れているのですか。

602 :132人目の素数さん:2006/10/24(火) 22:54:21
>601
何が違ってって・・・目的が違うんじゃないの?

603 :132人目の素数さん:2006/10/24(火) 22:56:40
>>602

どういう目的ですか?


604 :132人目の素数さん:2006/10/24(火) 23:05:57
>>592
分散を推定しなきゃいけない状況では、
分散の計算に用いる平均も、(母平均は判っておらず)データからの平均を用いる場合がほとんどだろう。
標本平均を固定すると、実質的に自由に動けるデータはn-1個になってしまう。
だからn-1で割る。

605 :中川泰秀 ◆tyvkWCNtzY :2006/10/25(水) 12:11:47
これは経済学の分野でもあるだろう。

606 :132人目の素数さん:2006/10/26(木) 13:25:28
教えてください。中央値の標準偏差の求め方が分かりません。平均の場合と同じでしょうか?
具体的には以下の例です。 単位は日です

平均(SD)  範囲     中央値(SD)
21.4(11.0) 10 - 100 7.0(1.0)

上の例では中央値が7なので、範囲には収まりませんが、これは範囲を 0 -90
に置き換えて、中央値を求めているということでしょうか?重ねて質問させていただきました。
よろしお願いします。

607 :132人目の素数さん:2006/10/30(月) 07:54:33
Gini indexの算出をSTATA9で行っています。主に、発展途上国の県ごとの学校数を調べてその均衡について調べたいのです。どのようにコマンドを打ち込めばよいのでしょう。
Indicatorは人口(pop), 学校数(sch)で各県ごとに分かっています。国の全人口に対する人口の割合をpop_f,学校の割合をsch_fとして、
sch_f/pop_fの小さい順にそれぞれの総計をだしてLourenz Curveはかきました。
95%CIを出すためにどうしてもSTATAが必要です。
コマンドの打ち込み方ご指導ください。お願い申し上げます。





608 :秘密:2006/11/05(日) 20:20:47
○このレスを見た人はめっちゃA幸運です○
> えっと、このレスを、違う掲示板3つに貼り付けてください!
> そうすると下記のよぅなことが起きますヨ♪
> ◆好きな人に告られる!!
> ◆告ったらOKもらえる!!
> ◆彼カノがいるコゎめっちゃLOVEAになれる!!
> ◆勉強、学年トップ!!
> ◆男女にモテる!!
> ◆5キロ痩せる!!
> ◆お小遣いが上がる!!
> 上記のことが起きます。
> あたしの友達Mが、これをやったら、上記全て起きて、今は彼氏とめっちゃラブ×2です
> 先生からも好かれ、男子に8人から告られました。
> 女子も友達がたっくさんいます!!
> この魔法のようなパヮーを信じて、貼り付けてください!!
> コレを信じなくて、貼り付けなかったKは、3日後に彼氏にフられて、5日後に告ったらフられて、一週間後に家族が死にました。
> そして一ヵ月後にはKが死んで、クラス全員でお葬式に出ています。
> さぁ、あなたはMかKかどちらになりたいですか?
> 信じるか、信じないかは、あなた次第です。
>
>    あなたが回してくれるのを信じています。。。



609 :132人目の素数さん:2006/11/07(火) 05:22:17
教育学系の論文を読んでいて分からないところがあったので質問させてください。
47都道府県における人口密度と不登校生徒出現率の相関について、
1990年度における相関係数は0.244であり、「有意な差はみられない」という記述がありました。
はたしてこの記述は正しいのでしょうか?
そもそも、47都道府県のデータに対して、有意性の検定をおこなうことはできるのでしょうか?
(全都道府県のデータは、標本ではなく母集団ではないのかと思うのです)

610 :132人目の素数さん:2006/11/08(水) 07:19:33
>>609
全都道府県の全生徒から不登校生徒を調べたのか?

611 :132人目の素数さん:2006/11/09(木) 05:56:23
>>610
返信ありがとうございます。
すみません、最初に補足しておかなければならないのですが、
この論文は、中学生の不登校に限定して書かれたものです。

「不登校生徒出現率=県内の中学不登校生徒数/県内の全中学校生徒数」です。
この不登校生徒出現率と人口密度との相関をスピアマン順位相関を用いて算出しています。
ですので、質問の答えはyesということになるのではないでしょうか。

612 :132人目の素数さん:2006/11/09(木) 21:07:48
「全数調査」「検定」で
ググってみると、ヒントがあるのではないかと。
検定とか推定に関するポリシーの問題なのでしょうかね。
私も勉強中の身ですので、どの意見が正しいのかわかりませんが。

613 :132人目の素数さん:2006/11/09(木) 23:38:55
>>609
612さんの言うように何を母集団と考えるかはポリシーの問題と言えるでしょう。
ただ、この手の問題に検定を使ってよいかということは別に考えるべきでしょう。
もし47都道府県で得られたデータの相関係数が0.3なら有意という結論になりますが、
相関係数0.3が特別主張するほど強い関係でしょうか?
もちろん相関が高くてもデータ数が少なくては意味がありませんから
その点は考慮すべきです。
20個以上のデータがあれば0.5以上の相関は有意となるので
あとは検定などせず相関の大きさのみで話をするのがよいと思います。


614 :132人目の素数さん:2006/11/10(金) 00:05:04
問題が解けなくて困っています。
どなたか教えていただけたら幸いです。

問題 
ある商品一個の重さ(単位g)は、平均10.5、分散0.8の正規分布に従う。
これを30個ずつ容器に入れて販売する。容器の重さは、平均24.0、分散3.0で正規分布する。
このパックの一箱の重さが350gを超える確立はどの程度か?

よろしくお願いします。


615 :132人目の素数さん:2006/11/10(金) 01:29:40
>>612
ありがとうございます。
青木先生のところの過去ログが未読だったので勉強になりました。
>>613
ありがとうございます。
>20個以上のデータがあれば0.5以上の相関は有意となるので
>あとは検定などせず相関の大きさのみで話をするのがよいと思います。
まったくそのとおりだとおもいました。

不登校に関する論文では、「とりあえずアスタリスクつけとけ」的な、
なんというか、「アスタリスクが多いほど良い」的な用法が慣習化しているようです。
全体的に論文が古いからなのでしょうか、
どうも相関係数を羅列しているだけの論文ばかりに思えるのです。
もし相関係数の用例について手本となるような論文をご存知でしたら、
何の分野でもかまいませんのでお教えいただきたいです。


616 :132人目の素数さん:2006/11/10(金) 21:35:40
どの分野でも古い論文なら星印の競い合いから逃れられないでしょう。
理系だと相関係数が0.5未満で有意だとして議論するのは少ないので
違和感を感じたことないなあ。大体普通は重回帰とかになるので相関係数
だけで議論するのは珍しいし。手本示せずスマソ。


617 :132人目の素数さん:2006/11/10(金) 22:10:47
大学のレポートです。単位が非常に危ない状況です。よかったら教えてください。
お礼も何かしらします。

ある工場で生産する製品はその2%が不良品である。確立95パーセント以上で
100個以上の良品を製造するには何個製造すればよいか?

618 :132人目の素数さん:2006/11/10(金) 23:16:05
>>617
お礼の中身を先に行ってくれ。
いくらか振り込んでくれるのか?

619 :132人目の素数さん:2006/11/10(金) 23:45:57
振込みでもいいですよ。そんなに大金は出せませんが。

620 :132人目の素数さん:2006/11/11(土) 09:42:35
>>617
         ,.∩        `ヽ
         〃∪'´ ̄`二二人\  ヽ
         | ツ´ ̄ ̄ ̄ ̄´ ヾ ヽ. ',
         |ハ ,ニ、   ,. - 、 | | | l |
         | ハ ィハ     ,二ヽ. | | | | |
         | | | じ'   |トJ〉  /)} l |
         | ハ  、'_,   ̄,, 厶イ川|
         l l /\    .. イV\川 |         確立の意味が分かりません。
         ,' l l ,イ `l ̄´ /   /ヽl l
         l | l ハ  `メ、    〃  ヽヽ、__ノ
         l  ∨ └‐イ「ト--ァ'´     ハヽ__ノ
         ヽ/  }  l」」 /     / }`ー
          〈_n| 八   / /     /ノ
          〈二二人 c /\/ / , イ
           /  /厂 /\__>< {_
           /  / /  /ハ \\ ト--- 、
          _/  //  /  ハ  \\     \
   , -‐ ''"´ /  /  / ̄\ `丶、   \ \  ヽ
  /  '´ ̄ ̄ / /  / \    \  \    ヽ \ ハ
  |    , -,--'  /    \    ヽ   \   ヽ  ∨
  ヽ、  //   /       ヽ   ____..--- 、  ハ
          ` ー─── ''"´        `ヽ、  | /
                             ` ┴′

621 :132人目の素数さん:2006/11/11(土) 12:59:51
establishment

622 :132人目の素数さん:2006/11/11(土) 18:15:19
>>616
レスありがとうございます。
>理系だと相関係数が0.5未満で有意だとして議論するのは少ないので
>違和感を感じたことないなあ。大体普通は重回帰とかになるので相関係数
>だけで議論するのは珍しいし
そうですね、たしかに相関係数だけで議論すること自体が謎です。
どうしてなんだろう・・・。

623 :132人目の素数さん:2006/11/11(土) 23:58:43
>>622
そもそも今回のケースはなぜ両方とも量的なデータなのに
順位相関係数なのかな?プロットを見てみないと分からんが、
下の方のごちゃごちゃしたところが順位にすることで無理矢理
分けられるので相関が低くなるように思う。

624 :132人目の素数さん:2006/11/12(日) 03:04:42
>>623
気になったので、2000年度のデータで散布図を描いてみたのですが、
どうも東京都(中央値300に対して5600)を筆頭に、
大阪府・神奈川県など、人口密度が外れ値的に高い県があって、
それにひっぱられるのを嫌ったようです。
2000年度ではピアソン0.299、スピアマン0.314ですので、
あまり変わらないようにも思えますが、、、
このあたりの係数の採用には、なにかしらの基準はあるのでしょうか?



625 :132人目の素数さん:2006/11/12(日) 13:55:50
>>624
外れ値的なものもあるのにピアソンの方が低いんですねえ。
ごちゃごちゃしたところもそれなりに分離しているからか。

量的データなのに順位相関を使うのは関係が曲がっているときでしょう。
外れているというのは関係を見るには大きな役割を果たすはずで
外れているから単純に順位相関というのはおかしいですね。
もしその2000年のデータが曲がった感じがするならスピアマンの方が
高かった原因かもしれません。


626 :132人目の素数さん:2006/11/13(月) 01:21:23
ききたいが
統計学は数学なのか?
色々解釈ってなんだよ・・・
社会科学じゃないのか???

627 :132人目の素数さん:2006/11/13(月) 01:26:56
問題が解けなくて困っています。
どなたか教えてください。

Xの分布関数をF(x)=∫f(t)dt (f(t)≧0)とする。
X^-1、cosX、|X|、を確立変数として、それぞれの分布関数をFまたはfで表せ。

お願いします。

628 :132人目の素数さん:2006/11/13(月) 02:44:23
>>626
細かいこと言えば統計は数学の一分野じゃなく
確率論を基盤とする応用分野だから応用数学であるし
いっそ工学と言ってしまってもいいだろう。

ただ社会科学は全然違う。

629 :132人目の素数さん:2006/11/13(月) 03:36:36
というか外国には統計学科がある大学もあるよね
日本では統計学教室って大抵文系の社会科学系の学部にあるような

630 :132人目の素数さん:2006/11/13(月) 04:29:33
社会科学の道具として使うからやね

631 :132人目の素数さん:2006/11/13(月) 04:39:01
正規分布のモーメント母関数が Mx(t)=e^{μt+(σ^2t^2/2)} と本に書いてあるの
ですが、導出がわかりません。積分でつまってしまいます。

とりあえず標準正規分布で考えて
Mx(t) = ∫[-∞,∞]e^(tx-x^2/2)dx
だと思うのですが、このあとどうすればいいのでしょう。

632 :132人目の素数さん:2006/11/13(月) 04:49:09
自己解決しました。eの指数の部分を完全平方にすることを狙えばよかった。

633 :132人目の素数さん:2006/11/13(月) 04:52:58
Mx(t) = {1/√(2π)}∫[-∞,∞]exp(tx-x^2/2)dx
= {1/√(2π)}*exp(t^2/2)*∫[-∞,∞]exp{-(1/2)(x-t)^2}dx
= {1/√(2π)}*exp(t^2/2)*∫[-∞,∞]exp{-(1/2)x^2}dx
= {1/√(2π)}*exp(t^2/2)*√(2π)
= exp(t^2/2)

634 :132人目の素数さん:2006/11/13(月) 05:54:10
ええとすいません、
∫[-∞,∞]exp{-(1/2)x^2}dx = √(2π)
になるのはどうしてでしょうか。

635 :132人目の素数さん:2006/11/14(火) 01:53:56
素人が質問させていただきます。

t検定で右片側検定したとき5%で有意となった場合でも
95%信頼区間に上の検定で有意となった値が含まれる場合はあり得ますか?

片側検定で有意でも、両側検定をすると有意でなくなる場合にありうると思うのですが
この場合、両側検定でやり直して、有意でない・・・と結論したくなるのですが
そうすると片側検定の存在意義ってなんなんだ?・・・と理解に苦しんでいます。

どなたか解説をおながいします。

636 :634:2006/11/14(火) 06:34:19
自己解決しました。ガウス積分というのを使うんですね。
こういう読み替え手法は少なくとも類例を知らないと思い付けないなあ。

637 :132人目の素数さん:2006/11/14(火) 23:06:38
>>635
授業の勉強なのか実践なのかで回答は違ってくるでしょう。
授業だとそんなものだと思うしかないでしょうが、実践だと
信頼率を90%にすると少し幸せになれます。さらに、
片側のときは2.5%を使う習慣をつけると整合性の面で
もっと幸せになれます。


638 :132人目の素数さん:2006/11/14(火) 23:46:08
>>637
 ありがとうございます。
危険率5%でこんなものだと思う事にしました。
そう・・・授業のレベルの話だったのですが、
実践にも使いますのでアドバイスの意をくませてもらって
 幸せになりたいと思います。

639 :132人目の素数さん:2006/11/15(水) 01:03:29
>>625
なるほど、そういう読み方をするのですね。
>外れているというのは関係を見るには大きな役割を果たすはずで
・・・とのことですが、具体的には、どのようなことを読み取ることができるのでしょうか?
散布図は「ごちゃごちゃ」+「外れ値」というかんじで、
曲がっているかどうかは判断できなさそうです。

640 :132人目の素数さん:2006/11/15(水) 04:48:18
信じられないほどレベルの低い質問で恐縮です。
基準の値が0の場合、増加率を出す式はどうなりますか?
統計ソフトで一斉に計算して、0で除算することになると
そこはデータが得られなくなってしまいます。
増加率なので、全部に定数を加減して0を出現させなければ
良いのですが、そのようなことをしなくても良い式など
ありそうなので、お聞きしようと思いました。
よろしくお願いします。

641 :132人目の素数さん:2006/11/15(水) 07:52:47
>>639
外れているのが異常値でないならどの方向かを的確に示している
ということです。外れている3点ほどがどれも正の相関を示す方に
きれいに並んでいるなら意味のない小さなデータが大量にあるから
相関が見えないだけで計算では出てこない相関があるのかも
しれません。(ただそれに適した統計的方法というか手順というかは
確立していないと思います。)


642 :132人目の素数さん:2006/11/15(水) 14:56:34
二元配置の反復測定分散分析が適応となるような繰り返しのあるデータで、でも
複数回連続測定後中央値を取って突発的雑音を回避しているデータがあるんですが、
こういう場合はノンパラしなきゃだめですか?

具体的には

エアー噴射30秒
直前 直後 1分後 5分後
ほにゃ らら ほげ はげ

霧吹きで5秒湿り気
直前 直後 1分後 5分後
はう すて らた とや

霧吹きで10秒湿り気
直前 直後 1分後 5分後
これ また しつ れい

みたいな

643 :132人目の素数さん:2006/11/15(水) 18:39:40
潮吹きで10秒湿り気
直前 直後 1分後 5分後
いく いく いっちゃ うー

644 :132人目の素数さん:2006/11/16(木) 09:37:42
>>642
繰り返し回数が多いなら標本中央値の分布は正規分布で近似できるので
普通の分散分析でいいと思います。

ところで具体例のような時系列の混じった形式でそもそもノンパラは
どのように行うつもりなのでしょうか?


645 :132人目の素数さん:2006/11/16(木) 11:20:48
二元配置でFriedmanつかえばよいのかなと思ってたんですが

646 :132人目の素数さん:2006/11/16(木) 15:25:17
すいませんが,どなたか教えていただけませんか?
平均値A(標準偏差a,個数n)を平均値B(標準偏差b,個数m)で割った場合,
A/Bの標準誤差って,どうやって出すんでしたっけ?

647 :132人目の素数さん:2006/11/16(木) 23:48:19
ベイズ統計についての質問はここでいいんですか?

648 :132人目の素数さん:2006/11/17(金) 09:50:12
>>645
時系列は全く無視ってことですね。
それぐらいなら普通の分散分析と大差ないのでは?
さらにパラメトリックなら対応のある場合の分散分析もできますし。


649 :132人目の素数さん:2006/11/17(金) 10:20:53
そうっすか。んじゃ2way repeated measures ANOVAでやっちゃいます

650 :132人目の素数さん:2006/11/17(金) 19:53:35
>>649
繰り返し数は一体どのぐらい?10ぐらいはあるの?
まさか2とか言わないよね?
繰り返し数が少ないなら中央値など取らずに全データで
ノンパラとかもあり得る。


651 :132人目の素数さん:2006/11/18(土) 07:51:49
2で中央値もくそもねーだろヴァカ

652 :132人目の素数さん:2006/11/18(土) 08:24:10
二元配置で繰り返しのあるといえば、測定対象が複数あって各セルに
その複数のデータを割り当てることでしょ。

>>650は繰り返し数っていってるけどある時点で同一対象を連続測定した
データ数と混同してるんじゃないか。


653 :132人目の素数さん:2006/11/18(土) 17:57:00
統計の問題なんですが・・、みなさんは以下の問題をどうやって解きますか?
正規母集団N(μ、ρ^2)において

 帰無仮説μ=0、対立仮説μ>0
この母集団からn個の独立な標本{x1、・・、xn}を抽出して
有意水準α%の仮説検定するとき、棄却域を求めよ

654 :132人目の素数さん:2006/11/19(日) 00:21:40
>>652
よく分かってそうだねえ。>>642のようなデータだと何が最適だと思う?
2way repeated measures ANOVAでFA?

655 :132人目の素数さん:2006/11/19(日) 01:07:36
>>653
ぜひ初心者向けの統計学の本を一冊買いましょう
大抵の場合は載っていますし、統計関連の他の勉強にも役立ちます


656 :132人目の素数さん:2006/11/19(日) 08:00:06
>>654
中央値を取るのかどうかとは別に、まず、Bartlett検定で等分散か
どうかを検定して、等分散とみなせるのだったら迷わず2way repeated
measures ANOVA。みなせないのだったら二元配置Friedmanもやってみて
都合のよい結果がでるほうを採択(うは




657 :132人目の素数さん:2006/11/19(日) 10:21:51
>>656
顕著に外れ値が出るってことだったから生データで等分散性は
ないでしょうね。(データが少ないと棄却はされないという可能性はあるが…)

ネットで見ても不等分散ならノンパラって見かけるけどノンパラの
前提は未知だけど同じ分布なんだけどね。まあパラよりロバストだとは
思うけど。中央値を使うという方法はロバスト的にはよさそうだね。


658 :132人目の素数さん:2006/11/19(日) 17:40:40
無知で文系の私にどなたか教えてください。
3つの尺度を使って分析を行いたいのですが、
2つの尺度の関連性を弱める媒介として残りの1つの尺度が
影響を与えているかどうかを調べたいとき、
どの分析方法を用いればいいのでしょうか?
重回帰⇒パス解析でいいのでしょうか・・?


659 :132人目の素数さん:2006/11/19(日) 19:08:04
>>658
たった3変数なんだよね?媒介の変数は決まっているんだよね?
単に相関と偏相関を見ればいいんじゃね?


660 :132人目の素数さん:2006/11/20(月) 07:16:40
>>656
なんで2wayなんですか?3wayじゃないの?

661 :132人目の素数さん:2006/11/20(月) 13:21:17
なんで?

662 :132人目の素数さん:2006/11/21(火) 18:40:45
すみません、おしえてください。

2群比較の問題で、処理群,コントロール群が存在する。
処理前観測値をB、処理後観測値をFとする。
B〜Poisson(μ)とし、
FにはBとの加法関係
F=B+Poisson(Q*B)
を想定する。ここに、Q〜Gamma(0.5,2.0)とする。
さらに、処理群には処理効果k(0<k<1)を掛け,kFとする。
このとき、処理効果の検出力を検討する。

英文論文からの転記なんですが、上記の仮定の意味が良くわかりません。
まずPoisson分布のパラメータに確率変数をもってくることが意味不明です。
こういうモデルってあるんでしょうか。
どなたかよろしくお願いいたします。

663 :132人目の素数さん:2006/11/21(火) 22:37:20
>>662
この分布を知っている訳ではありませんが、類似のものとしては
ベータ・二項分布がありますね。二項分布のパラメータpが
ベータ分布に従うというものです。これも同じような意味ですね。

理解は乱数で考えると分かりやすいですよ。
BとQをそれぞれポワソン乱数とガンマ乱数で作り、
その値でQ*Bをパラメータとしたポワソン乱数を作って
Fを構成するのです。ただし、Bは処理前値として対象ごとに
違うことは自明ですが、Qは対象ごとか処理ごとかが
不明ですね。



664 :662:2006/11/21(火) 23:33:13
>>663
早速にご丁寧な回答をありがとうございます。
成程、パラメータが確率変数とはそういう解釈をすればいいのですね。
一歩前進できました。ベータ二項分布も少し調べてみます。

因みに、処理群とコントロール群の差はkをかけるか否かであると思われますので、
Qは個体毎に与えられると思います。

しかし、BとFが加法関係構造にあるというのは未だ不明瞭です。
たしかにB+Po(QB)で和をとっているから加法というのもわからないでもないですが・・・

もう少し調べてみます。ありがとうございました。
これだ!というのがありましたらまたご教示いただきますと幸いです。

665 :132人目の素数さん:2006/11/22(水) 07:40:24
国勢調査の細かいデータって電話とかすれば提供してもらえる??

666 :132人目の素数さん:2006/11/23(木) 08:27:56
Barndorff-Nielsenはバルンドルフ・ニールセンで読み方あってますか?

667 :132人目の素数さん:2006/11/23(木) 09:40:04
AICで京都賞
ttp://www.inamori-f.or.jp/ja_kp_lau_thi.html

668 :132人目の素数さん:2006/11/23(木) 17:00:06
>>667
あ、それの公演(12日)いってきた。よかったよ。


669 :132人目の素数さん:2006/11/24(金) 23:44:29
はじめまして、初歩的な質問させてください。
実験を行い、その施行前と後でその変化に有意差があるかどうかを調べたいのですが、
t-検定:一対の標本による平均の検定
を使用していいのでしょうか?
これだけの情報だとわかりかねる場合はすみませんがレスお願いします
よろしくお願いします

670 :669:2006/11/25(土) 07:34:00
>>669です。
何の知識もなしに質問してすみませんでした。
この件に関しては自己解決しました。
今度は解析をしてみて、結果の解釈に困っています。

ウィルコクソン符号付順位和検定でデータ数は10です。
危険率を5%としたときに、P>0.05となるのですが、
T値は帰無仮説の棄却域に入らないとき、
有意差があると判断してよろしいのでしょうか?
何度もすみませんが、よろしくお願いします。


671 :132人目の素数さん:2006/11/26(日) 22:13:54
変数同士を合わせて新変数をつくり、新変数間でt検定を行いたい
のですが、変量の単位が%です。各変数は独立です。素データに戻
って新変数の%を算出できない事情があり、なんとか変量同士の合
成を行いたいのですが、標準化したら、%のデータ間の加減乗除で
合成変量をつくり、合成変数間の差の検定をして大丈夫でしょうか。

例えば視覚実験でターゲットの性質により検出の違いを見たいとして、
変数xが、1つの記号をターゲットとした場合の検出率、
変数yが、2つの記号をターゲットとした場合の検出率、
変数uが、1つの漢字をターゲットとした場合の検出率、
変数vが、2つの漢字をターゲットとした場合の検出率
で、それぞれの検出率だけがデータとして手元にある場合です。
ターゲットが1つか2つか、の差を見たい。あるいは記号か
漢字か、で差を見たいので、変数同士の合成が必要なのですが、
そもそも刺激中にそれぞれのターゲットが何個あったのか、
不明なので、検出率の単純合計は危険かと思われます。

変量を標準化したら、加減乗除して新変量をつくり、比較でき
ますか?もっと、ほかの操作が必要でしょうか。
すみませんが、よろしくお願いします。

672 :132人目の素数さん:2006/11/26(日) 22:35:25
>>671
x, y, u, vを標準化(平均0分散1)にしたら変数を足したものの平均も0になるので
どの組み合わせでも検定できません。それとも分散だけ揃えるのでしょうか?
各変数の分散に差があるかどうかの検定をしてなければ単純合計でいいように
思いますが。(と言っても対応があるなら足せますが、なければ分散分析するので
しょう。)
なお、もしターゲット数が検出率の平均にも影響すると考えているならそもそも
どうやっても比較できないでしょう。(たとえば、ターゲット数が多いと検出率が下がって
くると思っているなら検定で差が出たとしてもそれは個数や種類の差なのかターゲット数
自体のせいなのか区別する方法がありません。)


673 :132人目の素数さん:2006/11/27(月) 07:50:22
>>672
ご回答ありがとうございます。勉強が足りなくてすみません。

扱っているデータは、作業時間が一定で、被験者ごとに遂行
量が異なり、遂行分で遭遇した異なる種類のターゲットを、
それぞれ正しく検出した割合が変量として自動算出された
ものです。
その変量を合成して、別の角度から検討したいと思っている
のですが、割合は割合にすぎないので、単純合計してはいけ
ないように思ったのです。
変量xもyも同じ被験者から得られたもので、例えば全被験
者が10人だったとして、10人分のxとyの値を合計して
20で割ったものを、新しい変数の平均値としたり、xの平
均とyの平均を単純合計したものを新しい変数の値としては
ダメですよね。と、不安になりまして…。





674 :132人目の素数さん:2006/11/27(月) 09:38:01
>>673
前回書いたようにターゲット数によって検出率が変化すると思っているのかいないのかが
まず焦点です。思っているならお手上げです。
思っていないのなら対応がついているようなので平均を取ったり単純合計したりして
比較してもなんら問題ありません。
個数の違いならx+u-y-vの1標本の検定、種類の方はx+y-u-vの1標本の検定でしょう。
ただし、元が比率なので変化が大きい場合は線形ではないでしょう。
ロジット変換などの後に上記の計算をした方がより適切でしょう。


675 :132人目の素数さん:2006/11/27(月) 23:59:20
>>674
何度もありがとうございます。よく分かりました。
ターゲット数と検出率の関係は、遂行量データがあるので
別に考察できます。
とりあえず、無視してよし、として分析していきます。
分散分析をしてみて大体の傾向はつかめましたが、属性の
違いの作用をみたい場合は、どうしてもデータの合成に
直面しますので、単純に足してOKとうかがって、安心し
ました。
本当にありがとうございました。

676 :sage:2006/11/28(火) 00:27:27
質問ですが、正定置対象行列Σがあったとして、

|∂Σ/∂(Σ^-1)|  ←偏微分して行列式をとる。

を解きたいんですがどうしても解けません。
余因子を使って色々やったんですが、やり方がおかしいんでしょうか?
行列の微分に詳しい方いたら、ご教示下さい。
ちなみに、Σは統計学の分散共分散行列です。

677 :132人目の素数さん:2006/11/28(火) 09:57:22
>>675
分散分析してるのに属性の違いが見られないなんて…


678 :132人目の素数さん:2006/11/28(火) 14:25:31

{192 234 12 395}

という数値群があった場合、
このときの平均はもちろん
(192+234+12+395)/4 =208.25
です。
それでは、「この数値群の分散をもとめろ」
という場合、どういう公式・数式を使いますか?


679 :132人目の素数さん:2006/11/28(火) 14:30:13
分散:それぞれの値と平均との距離(偏差)の二乗の平均
なのだから、
{(192-208.25)^2 + (234-208.25)^2 + (12-208.25)^2 + (395-208.25)}/4
=74316.75

これでいいんですか?






680 :132人目の素数さん:2006/11/28(火) 14:34:56
質問させてください。
1個あたり物を10で仕入れ、50で販売し、余りは5で製造元に引き取っている店があるとする。
平均400分散120^2の正規分布に従っている。
いくつ仕入れると、最も利益が大きくなるか?
という問題で、正規分布から求めるらしいのですが、excelで正規分布表を作るときに
=(1/(120*SQRT(2*PI())))*(EXP(-(((B2-800)/120)^2)/2))
と入力したのですが、どこかが違っているみたいで正しい値が出ません。
この式のどこがおかしいのでしょうか?

681 :132人目の素数さん:2006/11/28(火) 15:00:57
>>680
>=(1/(120*SQRT(2*PI())))*(EXP(-(((B2-800)/120)^2)/2))

=(1/(120*SQRT(2*PI())))*(EXP(-(((B2-400)/120)^2)/2))
では?
正規分布の密度関数は normdist という関数で表せる。

682 :132人目の素数さん:2006/11/28(火) 15:06:20
分散がマイナスになることなんてありますか?

683 :132人目の素数さん:2006/11/28(火) 15:06:57
>>682
ない。

684 :132人目の素数さん:2006/11/28(火) 15:11:14
>>679
{(192-208.25)^2 + (234-208.25)^2 + (12-208.25)^2 + (395-208.25)^2}/4
=18579.1875
じゃないかな?

685 :132人目の素数さん:2006/11/28(火) 15:34:55
>>684
そのとおりです。
計算ミスでした。ご指摘ありがとうございます。


686 :680:2006/11/28(火) 15:47:04
>>681
ありがとうございます。この問題の解き方が分からないのですが、どなたか教えてくれませんか?

687 :680:2006/11/28(火) 15:48:02
>>681
ありがとうございます。この問題の解き方が分からないのですが、どなたか教えてくれませんか?

688 :132人目の素数さん:2006/11/29(水) 11:55:06
ある報告書に「信用区間による検定とは,ゼロが特定の区間(この場合95%,90%区間)
に含まれるかどうかの検定である」と書かれているのを見たのだけど、
1.信用区間と信頼区間は同じ?
2.95%信頼区間に0が含まれたら有意ではないとするのはよくあること?
教えてください。

689 :688:2006/11/29(水) 12:03:06
1.は自己解決しました。ウキペディアによると
信頼区間(confidence interval)と信用区間(credible interval)は違うもののようです。
ベイズ統計の報告書を読んでいたので、信用区間という言葉が出てきたようです。

690 :132人目の素数さん:2006/11/29(水) 23:52:34
すごい初心者な質問をさせてください。学校ででた問題で、
X〜N(30,4^2)とするとき、
(1)P(X<1)
(2)P(20<X<24)
(3)P(22<X<26)
これらの確率を求めるものです。(2)と(3)はわかったのですが(1)だけ
どうしてもわかりません。標準化すると-29/4もとい7.25になってしまい、
数表見ても載ってないんです。なんとなく0に限りなく近いかなとは思うのですが。
よろしければ教えてください。

691 :132人目の素数さん:2006/11/30(木) 01:09:32
>>690
それはいくらなんでも出題ミスじゃないの?
Rで計算したら一応2.083858e-13って答が出るけど
そんなものを求めさせて意味があるとは思えない。
(学校の宿題なら教科書の数表の範囲外を出すのは
まずいでしょう。統計ソフトを普段から使わせる授業なら
ともかく。)


692 :132人目の素数さん:2006/12/02(土) 00:42:54
質問させていただいてもよろしいでしょうか?

現在、マウスのある細胞に薬剤をかけて、
増殖速度がどのように変わるか、
という実験をやっています。

これをマウスを変えて三回ほど行いました。
(マウスの育った環境は同じ)

この場合、有意差検定というのは、
@、一つの対照群-試験群間で行うものなのか?

A、三回の試験群、対照群のそれぞれの平均を取って、
その統計量を元に2群間比較を行うべきなのか?

どちらか分からず立ち往生しております。

@の場合だと、あるものは有意差が出て、あるものは有意差が出ず、
という感じになり・・・。
また、それをどのようにまとめれば良いのか分からず・・・。

Aだと、有意差は出るのですが、
それが統計学的に妥当なことかどうかがわかりません。

少しでもいいので、どなたかアドバイスいただけると幸いです。

693 :132人目の素数さん:2006/12/02(土) 01:03:57
>>692
以下のような構造で分散分析して因子(種類)が棄却されるかどうか見ればいいのでは?

種類 回数 結果
対照群 第1回 xxxx
. . . . . . . .
対照群 第1回 xxxx
試験群 第1回 xxxx
. . . . . . . .
試験群 第1回 xxxx
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
対照群 第3回 xxxx
. . . . . . . .
対照群 第3回 xxxx
試験群 第3回 xxxx
. . . . . . . .
試験群 第3回 xxxx


694 :132人目の素数さん:2006/12/02(土) 01:38:24
>>693
ありがとうございます。
やってみます!

695 :132人目の素数さん:2006/12/02(土) 13:32:13
(別スレで質問していましたが、こっちに移動するよう提案されました)

「umbrella sampling」の日本語訳と定義を教えて下さい。
統計学の用語らしいですが、数学の英和辞典を見たり、ググったり
しましたが分かりませんでした。


696 :132人目の素数さん:2006/12/02(土) 16:46:39
MT法と重回帰分析の違いを教えてください。

697 :132人目の素数さん:2006/12/02(土) 22:09:06
ワロチのt検定wwwwwwwwおkwwwww

698 :132人目の素数さん:2006/12/02(土) 22:16:44
>>695
アンブレラサンプリングでいいんじゃないの?
 ググったらいっぱい出てくるから・・・。


699 :132人目の素数さん:2006/12/02(土) 22:43:33
統計専門の方、突然ですが一つ伺いたいことがあります。
「ある群から標本を抽出した結果あり、
それぞれ偏りなく同様に等しい確率で抽出された(単純無作為抽出)ということを検定したい」
のですが、何か良い処理法はありますか?
具体的には70の中から重複可能で50回抽出した結果があり、
そのうち6回抽出されたのが1つ、4回抽出されたのが1つ、
3回抽出されたのが2つ、2回抽出されたのが8つ、
1回が19個、残りは抽出されなかった…といった感じです。
(海外にいるので適当な本がみつからず、
ネットでもうまくヒットしないのでここに書くことにしました)

700 :695:2006/12/02(土) 23:26:21
>>698
Thx


701 :132人目の素数さん:2006/12/03(日) 10:56:14
t検定のことでお伺いしたいしたいのですが。
3群比較は偶然誤差が大きくなるので、t検定ではなく分散分析を一般的に言われています。
しかし、次のように考えられないでしょうか。
今3群、ケースA群、ケースB群、コントロール群があるとして、
A対B、A対コントロール、B対コントロールでそれぞれt検定します。
このとき有意水準を5%に設定したならば、実質的には1-(0.95)^3=0.142625、
つまり約14%となってしまいます。しかし、有意水準を1%に設定したならば、
1-(0.99)^3=0.029701、つまり約3%におさまります。
ならば、3群比較に1%有意水準を使うのは差し支えないといえるのでしょうか?
どなたかご教授していただいてよろしいでしょうか。お願いします。

702 :132人目の素数さん:2006/12/03(日) 10:59:07
>>699
合計抽出回数が51回となっていてどこかにミスがありますね。
概算だけど、重なるのが最大3回までで6割5分ぐらいはいきそうです。
4回までで9割ぐらいと言うところでしょうか。5回までだと9割7分ぐらいに
なってしまうようで6回重なったというのが本当なら棄却されるレベルかも。
ただし、正確な計算はとても大変であくまでも目安です。


703 :132人目の素数さん:2006/12/03(日) 12:42:08
>>701
普通に多重比較すればいいんじゃね?
独立じゃないからその計算も正確じゃないし。


704 :132人目の素数さん:2006/12/03(日) 22:13:06
>>702
ありがとうございます!サンプル総数については抽出なしが29個で、全50個です。
6回選択されたサンプルについては、ややバイアスがかかっていた可能性があるので、
棄却する必要があるかと考えていました。具体的な算式はどうすればよいのですか?
当初は正規曲線(高校数学で習う曲線)に回帰させれば良いのかと思いましたが、サンプル間に連続性がないので、
適用できるかわかりませんでした。他にローレンツ曲線がありますが、これはどうも検定とは関係なさそうに思えたのですが。
>>702さんは、どのような算式あるいは解析ソフト(?)を使われたのですか?

705 :132人目の素数さん:2006/12/04(月) 00:16:52
>>704
6+4+3*2+2*8+19=51なんですけど。1回なのが18でしょうか?
まあそれはさておき計算は単に純粋に確率を求めただけです。
ただそれだと場合の数が多くなるので適当に端折って大体求めてます。
計算はRでプログラムを書いて行いました。計算に間違いがないなら最も確率の
大きな組み合わせは0回が33、1回が26、2回が9、3回が2のときの0.04324218のときで
それ以後それより確率の小さなパターンが並びます。そのようにせずに何らかの
近似をする方法があるのかは知りません。
もし18,8,2,1,0,1が正しい50回の結果ならその確率は1.835095e-06ぐらいと
思われ、パターンの上から373個目ぐらいに当たります。
それより小さな確率となるパターンの合計確率はだいたい0.022です。
(なぜ「ぐらい」かというと枝刈りをして計算しているので刈った枝が計算結果に
影響している可能性があるためです。)


706 :132人目の素数さん:2006/12/04(月) 08:50:22
∞×0は、∞でしょうか。0でしょうか。

707 :132人目の素数さん:2006/12/04(月) 11:35:32
デルタ関数の積分は1だよな。

708 :132人目の素数さん:2006/12/04(月) 15:35:54
質問です。
複数の系列の散布図をエクセルに重ねて表示させています。
重なっている部分が見にくいので、
信頼楕円を換わりに描こうと思っています。

信頼楕円を描くアルゴリズムが知りたいです。
また、研究室のパソコンにオリジンがあり、
これでできそうな気がするのですが、
やり方がわかる人がいたら教えてください。


709 :大学生:2006/12/05(火) 10:50:12
確率変数Xが平均μ、分散σ^2をもつときE(X^2ー4)をμとσ^2で表せという問題なのですが、
誰か教えてください。よろしくお願いします。

710 :132人目の素数さん:2006/12/05(火) 17:30:22
お手元の統計の教科書をごらんください。
たとえそれが高校の数学の教科書であっても書いてある筈だから。

711 :132人目の素数さん:2006/12/05(火) 22:17:13
正規分布を書いて尖度と歪度を表したいのですが、縦軸と横軸には何の数値を書けばいいですか?

712 :132人目の素数さん:2006/12/05(火) 23:43:41
>>702、705さん
ありがとうございます、わかりました。
またRをインストールしました(でもプログラムがうまくかけない)
データの方ですが再チェックしました。計算法を知りたかったので、ちゃんとみていませんでした。
すみません。0*40+1*19+2*8+3*2+4*1+5*1=50です。
プログラムの書き方を紹介している良いサイトやこの検定(確率の算出)にかかわる用語やキーワード
があればおしえてください!

713 :132人目の素数さん:2006/12/06(水) 00:12:53
>>712
(40,19,8,2,1,1)のパターンなら確率0.000286で174番目、それより低い確率の合計は
0.0327でまだ棄却されるレベルですが、前よりはましですね。
計算の元になるサイトはないです。自分で考えただけですから。
(70,0,0,0,0,0)から始めて1回の抽出ずつ計算します。次は確実に(69,1,0,0,0,0)ですね。
その次は確率69/70で(68,2,0,0,0,0)で確率1/70で(69,0,1,0,0,0)に分かれます。
あとはこれを丁寧に計算していくだけです。ただし、すべてのパターンを計算するのは
メモリーと時間の関係上無理だと思います。私は6回以上の抽出はひとまとめにして
パターンの保存も200までで打ち切ってそれより小さなものは合計確率のみで計算
していきました。


714 :132人目の素数さん:2006/12/06(水) 13:10:18
>>702(705,713)さん
ずいぶんと手間をとらせてしまったようで。。。ありがとうございます!
わかました。データはやはり無作為というには無理があるようですね。
当初、データを(40,19,8,2,1,1)と並べて、正規分布(の右半分)と使って比較するのは
どうかと考えたのですが、これは数学的に意味のある処理でしょうか。
他にもデータがあるもので。。。いずれにせよ、お聞きする前はまったくわからなかったので
検定の結果がわかったのはずいぶんと参考になりました。ありがとうございました。

715 :132人目の素数さん:2006/12/06(水) 18:00:04
すみません、初歩的なのですが質問させてください。。

エクセルを使って発生させた正規分布に従う乱数をもとに、
自由度を設定してカイ2乗分布に従う乱数を作成するには
どうすればよいのでしょうか?

716 :132人目の素数さん:2006/12/06(水) 18:33:23
>711
正規分布だったらskewnessもkurtosisも定数なような・・・

717 :132人目の素数さん:2006/12/06(水) 20:01:34
いろいろ考えましたが、そんなに単純には算出できないことがわかりました。
確かに計算は煩雑ですね。>>714より。

718 :132人目の素数さん:2006/12/06(水) 20:20:52
>>702(705,713)さん
たびたびすみません。モンテカルロ法のように、50回のランダム抽出を繰り返して、
一番多い組み合わせを取るのはどうでしょうか。。。組み合わせが多すぎて駄目かな。。。


719 :132人目の素数さん:2006/12/07(木) 00:36:14
>>718
私も初めは乱数でできるだろうと思ったのですが、重複が5回以上の所は滅多に
起きないため、正確な頻度を見積もるには何回行えばいいのか分からず結局
正確に計算してみようと思ったわけです。

さて、枝刈りして得られた375のパターンから各重複回数に対する期待値を近似的に
求めてみました。
(確率0.0225に対する残りの多くのパターンは無視してますので合計が70になるように
補正をかけています。)
0回:34.02379, 1回:24.76589, 2回:8.81109, 3回:2.02631, 4回:0.33286, 5回:0.03884,
6回以上:0.00123
下がり方は緩やかなため正規確率の当てはめはよくないですね。
何がいいのか分かる猛者がいたら教えてほしいです。

これで、上記があれば検定は可能かと思ったのですが、カイ二乗近似では4回以上の
少ないところは当てはまりがよくなくて使えませんし、正確に多項分布で行うにはこれまた
大変のようです。
たとえば、6回以上が出てくるのはおかしいと言えるのですが、5回が出てくるともうだめ
なのかというと(35,24,9,1,0,1)だと確率0.14ぐらいで起こります。一律に基準を設けるのは
とても大変そうですね。
また、データがたくさんあるとのことですが、多くあればあるほどまれなパターンも生じます
ので先のデータが30個のうちの1つだとすると確率0.03ですので普通のことかもしれません。


720 :132人目の素数さん:2006/12/08(金) 17:15:10
真面目な質問なのですが、
∞×0は、∞でしょうか。0でしょうか。

721 :132人目の素数さん:2006/12/08(金) 17:51:17
>>720
∞と0と×の定義による

722 :132人目の素数さん:2006/12/08(金) 18:34:17
>>720
0と無限大の濃さによる
結果はより高位なほうをとる

723 :132人目の素数さん:2006/12/08(金) 21:51:43
確率統計って主観なしの学問なの?
データからある数値(例えば平均値)を抽出して何かを予測してみたり
散布図に回帰直線を書いて相関関係があるな、とか
ようするに帰納法でしょ。
帰納法って数学じゃないんじゃないの?
演繹こそが数学だと思うんだけど。
つまり確率統計って数学じゃないんじゃないの?

724 :132人目の素数さん:2006/12/08(金) 23:23:54
>>723
二元論にこだわるなら
http://www.nn.iij4u.or.jp/~hsat/misc/math/deducinduc.html
でも読んでみたら?

725 :132人目の素数さん:2006/12/09(土) 00:04:01
初心者です。臨床研究をしています。
ある疾患群で特定の成分が血液中に多い、というねたでリサーチしてましたら
ある成分の血中濃度に男女差があることがわかりました。この場合
コントロールとある疾患群で、その成分濃度に差があるというためには
男女別々に解析しないとだめなのですか?
教えていただければ幸いです。

726 :132人目の素数さん:2006/12/09(土) 00:32:56
>>725
「交絡因子」って言っても分からないよね…。
男女差を考慮しながら分析する方法があるのだが、
その用語でぐぐってあとはがんばってくれ。
(検索後もちんぷんかんぷんならまじで素養が低すぎる。
ここではなく誰か生身の統計の分かる人に相談した方がいいよ…。)

727 :132人目の素数さん:2006/12/09(土) 00:36:42
男女差が交絡因子ですか?



728 :132人目の素数さん:2006/12/09(土) 00:55:49

わかりました!さっそく明日頑張ります

729 :132人目の素数さん:2006/12/09(土) 13:02:41
>>719
やはり難しいのですね。でも>>719の説明でかなりすっきりしてきました。
とりあえず明確な解析結果は避けて、無作為抽出にしてはやや偏りがみられるという
判断でいこうと思います!!!!
本当にありがとうございました!

730 :132人目の素数さん:2006/12/09(土) 23:14:07
>>723
統計科学は数学じゃないよ。経験則的なところもあるし。
帰納的なのが統計科学の特徴じゃん。まずデータありき。
主観なしではないけどね。結果を自分なりに解釈するのが統計家だし。

731 :132人目の素数さん:2006/12/10(日) 07:02:01
>>730
データがあって、主観的な統計モデルがあって、適当に当てはめて悦になるのが統計科学です。

732 :132人目の素数さん:2006/12/10(日) 07:43:10
>>731
随分主観的だなw

733 :132人目の素数さん:2006/12/10(日) 07:53:36
統計って科学なの?
統計に反証可能性ってあるっけ?

734 :132人目の素数さん:2006/12/10(日) 09:06:14
>>733
教えて君退場!

735 :おしえてください君:2006/12/10(日) 11:26:37
私も臨床研究をしているのですが、
ある血液検査値が基準値より上昇している「群」についてまとめたいのですが、

@一般的には、過去のデータと比較しようが無いときに
群のうち何%以上の個体が上昇しているのが「多い」と考えるのでしょうか?

Aもし基準が無ければ、「多い」という基準はどのように示すのが妥当
でしょうか?

おねげします

736 :132人目の素数さん:2006/12/10(日) 12:14:40
だいたいものの判断を完全に科学的に出来るなんていうのはありえないし、
そんな科学は社会的に必要とされない

737 :おしえてください君:2006/12/10(日) 18:10:10
すみません、よくわかりません

738 :132人目の素数さん:2006/12/10(日) 19:36:07
>>735
上昇してるって事は過去のデータがあるんじゃないの?


739 :132人目の素数さん:2006/12/10(日) 21:14:16
質問よろしいでしょうか。

年齢、スポーツ歴などランダムに選出した被検者にそれぞれ100m走や
潜水などの運動をしてもらい、平常時の心拍数と比較して最も変化の
あったものを求めたいのですが、この場合は対応のあるt検定を使用して
よろしいでしょうか?

宜しくお願い致します。

740 :730:2006/12/10(日) 22:45:30
>>731
まぁある意味ではそうだねw

741 :132人目の素数さん:2006/12/11(月) 00:23:38
>>739
最も変化のあったものというのなら個人での平常時との差を種目ごとに取って
その平均値を比べれば分かるよな。それが有意かどうかということになると
多重性を考慮するかどうかって問題になるが。

742 :132人目の素数さん:2006/12/11(月) 00:26:10
>>704

>6回選択されたサンプルについては、ややバイアスがかかっていた可能性があるので、棄却する必要があるかと考えていました。具体的な算式はどうすればよいのですか?

であれば、

>ある群から標本を抽出した結果あり、
それぞれ偏りなく同様に等しい確率で抽出された(単純無作為抽出)

ではなく、

p1=(6回発生した問題の事象Aが起こる確率)
p2=(のこり69個の事象ひとつひとつについて起こる等しい確率)
(日本語がおかしいですが、適宜解釈してください)

として、「p1=p2 を検定する」が正しいのではないでしょうか?
単純な問題なので、自分で考えても分かると思いますが、

p1=p2=1/70 と仮定し、50回中事象A の起こりうる回数をN とすると、
P(N=0) = 50C0  (1/70)^0 (69/70)^50 = 0.4876
P(N=1)=  50C1  (1/70)^1 (69/70)^49 = 0.3529
P(N=2) = 50C2  (1/70)^2 (69/70)^48 = 0.1253
P(N=3) = 50C3 (1/70)^3 (69/70)^47 = 0.0290

P(N<=3) = 0.9943 なので、1%棄却粋は、N>=4 であり、
6回起きているので、p1 と p2 は等しくない。

こちらのほうがまだいいのではないですか?

743 :132人目の素数さん:2006/12/11(月) 00:31:41
>>739

t検定は正規分布を仮定しての検定ですので、t検定を行う前に、まず正規分布に適合するかどうかを検定しないと、信頼性は無くなると思うのですが・・・。

あまり、古典理論を勉強していないので、嘘かもしれません。

744 :132人目の素数さん:2006/12/11(月) 01:04:19
>>742
もし特定のサンプルがあやしいと事前に思っているならそれでいいでしょうね。
どれか分からないが偏っているのでは?という問題として719は解きました。

745 :132人目の素数さん:2006/12/11(月) 02:18:31
実務的な統計学の本によくある言葉・・・
「著者の経験から・・・・が妥当なのではないかと
考えられます。」
この学問(?)終わってる・・・

746 :132人目の素数さん:2006/12/11(月) 02:25:21
統計学を人文学に認定します
これにはだれも反論できない

747 :132人目の素数さん:2006/12/11(月) 08:14:08
>>746
おつかれさんですっ

748 :おしえてください君:2006/12/11(月) 10:29:42
なるへそ

749 :132人目の素数さん:2006/12/11(月) 17:07:41
rをデータ(Xi, Yi), i=1, 2, …, n の相関係数とすると、データ(aXi+b, cYi+d)の相関係数は

ac>0のときr
ac<0のとき-r

となりますか?教えてください。

750 :132人目の素数さん:2006/12/11(月) 21:26:47
てか
ぶっちゃけこのスレ板違いじゃね?
削除依頼ヨロ

751 :132人目の素数さん:2006/12/11(月) 21:56:42
http://yasai.2ch.net/psycho/kako/1013/10137/1013732790.html

>これは確率空間の数学的構造が我々が住んでいる世界の構造や関係に
>マッチしていないからではないか、マッチする数学的構造は
>別にあるのではないか、

>確率論的なモデルが、 ・・・
>精度がじょじょに上がって来て、そのうちに実用に供されそうだ、
>というレベルでは全くない
>絶望的レベルであり、
>「学習率ゼロ」の惨憺たる状態


絶望的レベルだそうです。。。
マッチしてないそうです。。。

752 :132人目の素数さん:2006/12/11(月) 21:58:28
>カオス的変動の予測にことごとく、
>しかも必然的に失敗し、


「ことごと」く、
「必然的」に、
失敗するそうです。。。

753 :おしえてください君:2006/12/12(火) 18:53:12
>>735です。
ピアソンかスピアマンの選択で悩んでおります

ある測定値Aは測定上限がありませんが、
他方の測定値Bは、ある限界値以上は一定の測定限界値として表示されます。
二つの測定値について論じるために臨床研究しているのですが、
相関係数を出すにはどうしたらよかでしょうか


754 :132人目の素数さん:2006/12/12(火) 21:06:34
>>753
あんまそんなんで悩むな必要無いぞ。
両方計算して、結果をここにさらしてみ。

755 :132人目の素数さん:2006/12/13(水) 05:06:46
>>754
測定限界値があるのに?
ノンパラ以外考えられないと素人は愚考します。
>>753じゃないよ

756 :132人目の素数さん:2006/12/13(水) 06:11:46
>>755
これだから素人君は困っちゃうね

757 :おしえてください君:2006/12/13(水) 08:32:17
えーと、
データ個数は400以上で
ピアソンだとr=0.18
スピアマンだとrs=0.30
です。
測定限界値はどう解釈するべきでしょうか

758 :132人目の素数さん:2006/12/13(水) 11:18:11
>>757
そのピアソンはどうやって計算したの?測定限界値を何かの数字に置き換えた?

759 :おしえてください君:2006/12/13(水) 11:35:14
測定限界値を測定上限値に置き換えました。

760 :132人目の素数さん:2006/12/14(木) 20:34:55
>>169
>q-qプロットの説明が色々・・・・
”関数qq.plotを用いて、正規分布、t分布、カイ2乗分布、
F分布などのQQプロットを作成することができる・・・”
フリーソフトによるデータ解析・マイニング 第39回
http://www1.doshisha.ac.jp/~mjin/R/200610_39.pdf

761 :132人目の素数さん:2006/12/15(金) 14:07:13
プロ野球のデータ分析をしたいんですけど、
どこにデータ有りますかね?

762 :132人目の素数さん:2006/12/15(金) 14:29:23
個人使用が可能かどうかわからないが
ttp://ja.wikipedia.org/wiki/NPB%E3%83%BBBIS

763 :132人目の素数さん:2006/12/15(金) 16:22:34
スレ違いだったらスマソ
大学で数理統計学取ってるんだが
教科書がなんか無駄に難しい解説でとっつきにくいので
なんかわかりやすく解説してある参考書知らない?
これはお勧めってのがあれば教えてほしい

764 :132人目の素数さん:2006/12/15(金) 22:09:16
東大出版の統計学を読むべし
わからないところはマンガでわかる統計学とかで軽く理解してから読めばいいのかな

765 :132人目の素数さん:2006/12/15(金) 23:19:41
>>763
「ハンバーガー統計学」でぐぐってみて!

766 :132人目の素数さん:2006/12/15(金) 23:22:08
ワロスのt検定

767 :132人目の素数さん:2006/12/16(土) 07:27:49
確率統計はことごとく必然的に予測をはずすとまで言われて
このスレの人はどうして何も反論しないんですか?


768 :132人目の素数さん:2006/12/16(土) 19:12:33
>>765
これらの独習サイトのことか。
ハンバーガー統計学にようこそ!
http://kogolab.jp/elearn/hamburger/index.html
アイスクリーム屋さんで学ぶ楽しい統計学
http://kogolab.jp/elearn/icecream/index.html

769 :132人目の素数さん:2006/12/17(日) 10:08:24
>>767
"ことごとく必然的"の意味がわからないからです


770 :132人目の素数さん:2006/12/17(日) 21:44:43
対応のある群間の平均値差って、t検定でも分散分析でも
オブザベーション数を倍増させた感じで入力しなおさないと無理ですか?
個別の変数として横並びで入力したデータのままで何とかならないかしら。

771 :132人目の素数さん:2006/12/17(日) 21:51:45
こういう感じになるのかなぁ>>693

772 :132人目の素数さん:2006/12/18(月) 07:47:59
>>770
ただ単に横並びのベクトルだとコンピュータがどれがどれか認識できないでしょうよ。
下か上かに対応する群番号ベクトルでも振ってたら別でしょうけど。


773 :132人目の素数さん:2006/12/18(月) 07:52:39
>>770
どっちでも検定できると思うんだけど、
例えば、ID,1回目, 2回目という変数が並んだCSVがあるなら、
x <- read.csv("hoge.csv") #読み込み
t.test(x[,2],x[,3],paired=TRUE) #対応のあるt検定
あっ、Rの場合ね。

774 :132人目の素数さん:2006/12/20(水) 11:58:30
P(X=x)を与える関数f(x)、
連続型確率分布では確率密度関数という名前だけど、
離散型の場合はなんて呼ぶのですか?

775 :132人目の素数さん:2006/12/20(水) 12:34:21
>>774
確率関数、と呼ぶのが普通かな。

776 :132人目の素数さん:2006/12/20(水) 21:58:14
アンケートをだすと、必ず正論とは反対の意見が10%〜20%はでる、って理論について詳しく知りたいです。
分かる人、(名前だけでも)教えてシルブプレ

777 :132人目の素数さん:2006/12/20(水) 22:38:29
>>776
その理論は知らんが、「全体の〜%」のような表現をする理論(というか経験則というか)にはパレートの法則とか働き蜂の原理とかがある。



778 :132人目の素数さん:2006/12/21(木) 00:29:49
>>763
764と同じく東大出版をおすすめ。

統計学入門
人文・社会科学の統計学
自然科学の統計学

の3冊から自分にあったのを選べば無難だと思う。

>>776
それは単なる経験則ではないのでしょうか?
厳密に、数理統計学として証明できるものではないとおもわれ。

779 :132人目の素数さん:2006/12/23(土) 05:34:23
クロスバリデーションって、簡単に言うと何ですか?

780 :132人目の素数さん:2006/12/23(土) 16:08:08
回帰分析みたいな感じで
答えに右か左かみたいな質的変数を予測できるようなのってありませんか?

781 :132人目の素数さん:2006/12/23(土) 22:50:00
>>779
主に判別分析でデータの半分で残りの半分を判別することをデータを入れ替えて2回行い、
より正確と思われる判別率を求める方法。交叉確認法。(で分かるかなあ…)

782 :132人目の素数さん:2006/12/23(土) 22:52:39
>>780
状況がよく分からないけど、判別分析かロジスティック回帰かな。

783 :780:2006/12/24(日) 12:33:31
あ、すみません。
不動産屋なんですが、
何人家族のお客さんがどんな間取りを選ぶかを
統計的なデータで示したいんですよ。

そのキーワードで書店で探してみますね。

784 :132人目の素数さん:2006/12/24(日) 14:52:32
>>783
そうなら説明変数も分類が混じってくるかもな。
さらに目的変数の分類が複数となると数量化II類かな。

785 :132人目の素数さん:2006/12/25(月) 21:15:23
質問です。
母平均の推定でt分布を利用するのは
1.正規母集団
2.σが未知
3.n<30
を満たすときとあるのですが、
1.正規母集団
2.σが既知
3.n<30
のときはどうやればいいですか?

786 :132人目の素数さん:2006/12/25(月) 21:52:48
>>785
σが既知なら正規分布をそのまま使えばいいじゃん。


787 :785:2006/12/25(月) 22:15:36
どうも!

788 :132人目の素数さん:2006/12/26(火) 00:00:45
ものすご〜く初心者的な質問だと思うのですが、
一人暮らしの人53人、同居してる人62人など母集団の数が違う2群で、
同じ一つの質問に「はい」と答えた人の割合を検定したいんですが、
カイ二乗とt検定、どちらを使えばよろしいのでしょうか。

789 :132人目の素数さん:2006/12/26(火) 00:51:05
>>788
Fisherの正確確率検定っていうのもあるよ。

790 :132人目の素数さん:2006/12/26(火) 01:39:58
>>789

ありがとうございます。
でも、カイ二乗とt検定のどちらかを使わなきゃいけないんです。
どちらが良いんでしょうか・・

791 :132人目の素数さん:2006/12/26(火) 20:04:17
ロジスティック回帰分析を解説したようなHPってどこかにありませんか?

792 :統計素てきな人:2006/12/27(水) 01:04:42
非線形回帰の係数のp値を出してくれるフリーソフトがあるって聞いたのですが、R以外にありますか?
ていうかRとSAS以外にいいのありますか?

793 :統計素てきな人:2006/12/27(水) 01:07:52
>>791

解説ではないけれど

http://www.lightstone.co.jp/products/origin/nlfunc/flist4.htm

794 :779:2006/12/27(水) 04:39:26
>>781

データの半分で残りの半分を判別することの意味は何ですか?

795 :132人目の素数さん:2006/12/27(水) 10:11:42
>>794
判別分析って分かってますか?知らないなら教科書を読みましょう。


796 :sage:2006/12/27(水) 17:44:44
誤差の伝播についてですがわかる方いないでしょうか?
もっと適切なスレがあればお教えいただければ幸いです

---問題ここから
計測したい物理量:ある長方形の面積A
実測される物理量:その長方形の縦の長さh、横の長さw

繰り返し測定を行ないその結果として
hi(i=1,2,...,N)、wi(i=1,2,...,N)
が得られる。これらの実測値には誤差としてランダム誤差のみ
が含まれているものとする

(計算方法1) A1 = [Σ(hi x wi)] / N
(計算方法2) A2 = (Σhi)/N x (Σwi)/N

A1とA2ではどちらが誤差(残差)の標準偏差が小さくなるといえるのか?
それとも比較自体がナンセンス?
---問題ここまで

要するに
掛け算をした後に平均を求めるのか
平均を求めた後で掛け算をするのか
という違いです

質問にあたって
http://amazon.co.jp/o/ASIN/480790521X/
をすべて読んでおりますので誤差の伝播については少しは
理解しており、自力で解析を試みましたが解決できず
途方にくれています
どなたかお力を・・・


797 :796:2006/12/27(水) 18:59:48
質問内容について少し補足します
> A1とA2ではどちらが誤差(残差)の標準偏差が小さくなるといえるのか?
これはN回の測定を1セットとしてこれをM回繰り返して
A1j(j=1,2,...,M)、A2j(j=1,2,...,M)
という結果を得たときのA1の標準偏差、A2の標準偏差のことです

(計算方法1)を使った場合、N回の測定から得られるA1の標準偏差がσ1なら
A1のM個の集合A1Mの標準偏差σ1Mは
σ1M = σ1/√M
になることはわかります

(計算方法2)を使った場合、http://amazon.co.jp/o/ASIN/480790521X/
の「誤差の伝播に関する規則」の「積」の場合を利用すると
N回の測定から得られるh、wの標準偏差がσh、σwなら
A2のM個の集合A2Mの標準偏差σ2Mは
σ2M/|A| = √[(σ2/h)^2 x (σ2/w)^2]
になることはわかります

しかし(計算方法2)の方には最良推定値(N回の測定の平均値)A、h、wが含まれて
しまうため,(計算方法1)と(計算方法2)の良し悪しの比較が簡単ではありません

そういうものなのかなぁとも思うのですが
そんなに難しい話なのか? という疑問がぬぐえません
何か深みにはまっている気がします・・・

---
話がややこしくなってきましたが
要するに計測を行なうときに(計算方法1)と(計算方法2)はどちらが良い精度になるのか?
という質問です


798 :132人目の素数さん:2006/12/28(木) 01:15:23
> a1 <- function() sum((runif(100)+1)*(runif(100)+1))/100
> x1 <- vector(); for (i in 1:1000) x1 <<- c(x1,a1())
> sd(x1)
[1] 0.06115756
> a2 <- function() (sum(runif(100)+1)/100)*(sum(runif(100)+1)/100)
> x2 <- vector(); for (i in 1:1000) x2 <<- c(x2,a2())
> sd(x2)
[1] 0.06233367

A1の方がよさげだな

799 :132人目の素数さん:2006/12/28(木) 01:21:28
>>796-797
H=h+e, W=w+f, e~N(0,σ^2), f~N(0,σ^2), eとfは独立
なら計算方法1の分散は(σ^2(h^2+w^2)+σ^4)/N、
計算方法2の分散は(σ^2(h^2+w^2)+σ^4/N)/Nになると思うんだけど
それなら常に計算方法2の方が誤差は小さいね。
と言ってもσが小さいとその差はごくわずかだね。

800 :132人目の素数さん:2006/12/28(木) 01:31:00
>>798
一様分布でも分散の計算は同じだから理論値は
> sqrt(((1/12)*1.5^2*2+(1/12)^2)/100)
[1] 0.06180165
> sqrt(((1/12)*1.5^2*2+(1/12)^2/100)/100)
[1] 0.06124291
となるね。

801 :796:2006/12/28(木) 10:31:17
皆様ありがとうございます
まだ皆様の返答のすべてを理解できていないのでとりあえずのお返事をします
長い目でお付き合いいただければ幸いです

訂正事項
>>797
> σ2M/|A| = √[(σ2/h)^2 x (σ2/w)^2]
正しくは
σ2M/|A| = √[(σh/h)^2 + (σw/w)^2]

お返事
>>798
これRのコードですよね(恥ずかしながらRにはウトいです)
素人目に見たところ1を真の値に見立てて
それに乱数(一様分布)を加えてこれを誤差(残差)としているようですね
この場合にはA1の方がよいと考えられると...
この計算例が「例の精度」についての適切な指標になるのか今自分なり
に検討中です

802 :796:2006/12/28(木) 10:32:01
>>799
これはhとwを真の値と見立てて
正規分布の誤差が加わった場合ですよね
シンプルな考え方でひょっとしたらこの考え方は問題の解に近づけそう
な気がします(解かもしれませんが...)
まだ理解できないので今統計学の本と格闘中です

803 :796:2006/12/28(木) 10:32:48
>>800
1/12とか1.5とかどこから出てきた数値なのかわからないのですが
798さんの答えとは反対のようですね

804 :132人目の素数さん:2006/12/28(木) 14:04:04
>>788

>一人暮らしの人53人、同居してる人62人など母集団の数が違う2群で、
>同じ一つの質問に「はい」と答えた人の割合を検定したいんですが、
>カイ二乗とt検定、どちらを使えばよろしいのでしょうか。

カイ2乗検定使えぱよい

t検定は、2群から得られた平均値の差の検定に使う。
ところが、「はい」「いいえ」に平均値なんかないから
t検定は使えない。

「はい」に1を割り振って、「いいえ」に2を割り振って、
平均値なんか求めてはいけない。「はい」と「いいえ」
は質的な違いであって、量的な違いではないから。

てな具合で、分かってもらえるかな??

805 :132人目の素数さん:2006/12/28(木) 14:12:17
>>790
>>804です。>>789さんのおっしゃる「Fisherの正確確率検定」は
データ数が多いときに手計算すると大変な目に遭うから、使う場
合を学んでおきましょう。階乗の計算をいくつもしなくてはならな
いから…。泣くよ。

詳しくは統計学の教科書の「独立性の検定」の部分を読んで下さ
い。「Fisherの正確確率検定」(あるいは「Fisherの直接確率法」)
を使う場合についても解説されているはずです。


806 :132人目の素数さん:2006/12/28(木) 19:02:05
>>803
1.5は一様分布に1を加えた場合の平均、1/12は一様分布の分散です。
シミュレーションはシミュレーションの誤差がありますから目安にはなりますが、
必ず正しいとは限りません。今回は結果が非常に近かったためまだ誤差の範疇で
結果が逆転したと思っています。

807 :132人目の素数さん:2006/12/28(木) 19:03:55
>>805
さすがに手計算するものとは思ってませんでした。
手計算するなら確かにやめておいた方が無難でしょう。
例に挙げられた例数ならRで計算することが可能だと思います。

808 :132人目の素数さん:2006/12/28(木) 22:31:47
>>807
>>805@homeです。「人を見て法を説け」だっけか??質問の仕方から想像するに
手計算しそうな雰囲気を感じた。式を見たとたんに絶望感に襲われそうな雰囲気。
例数から考えて、Fisherを使わなくても済みそうだなという悪寒…
違ったらごめん。

809 :132人目の素数さん:2006/12/29(金) 01:37:55
初書きで失礼致します。
ここは推測統計なる問題の質問をしても良い場でしょうか?

810 :132人目の素数さん:2006/12/29(金) 02:01:47
>>809
「統計学なんでもスレッド」だから、何でもいいんじゃない??


811 :132人目の素数さん:2006/12/29(金) 02:31:30
どうも、それでは少しお邪魔させて頂きます。
性悪な教授に課題を出されて参っております。良ければ知恵を貸して下さい。


・問題
A社の工場で実験を12回行った。この時原料100kg当りの収率は以下の通りであった。
38.0 37.5 35.1 38.3 36.3 37.8
36.8 35.9 37.7 38.2 35.7 38.6
この反応の収率に関して母分数の信頼区間を求めよ。但し信頼度は98%とする。

注)必要なら次の数値を用いなさい
   xx(11、0.99)=3.053  xx(11、0.01)=24.725
   (xの二乗の右肩につく2が書けないのでxxとしました)
   答えは少数第三位まで求めよ
   計算プロセス必須

という問題です。
恥ずかしながら、基礎を学ぶ筈であったこの講義で、
「これ解けたらSやるよ。無理だとわかってるから言うんだけどね」と侮蔑たっぷりに言われ、
しかしランクも高くない大学ゆえに私も友人知人もみな全滅です。
このままでは悔しく、そもそもこんな不条理で単位も危うい状況です。

恐れ入りますが、この問題を解けるという方がおられれば、お力添えをお願い致します。


812 :132人目の素数さん:2006/12/29(金) 09:08:55
>811
>性悪な教授に課題を出されて参っております。良ければ知恵を貸して下さい。

χをxという学生に性悪と言われては困るね。
来年があるよ。まぁ、がんばりたまえ。

813 :132人目の素数さん:2006/12/29(金) 09:21:31
なんでカイスクなん?
tじゃないの?

814 :132人目の素数さん:2006/12/29(金) 09:33:57
ああ母平均じゃなくて母分散なのね。母分数でもなくて。

> 11*var(c(38.0,37.5,35.1,38.3,36.3,37.8,36.8,35.9,37.7,38.2,35.7,38.6))/c(qchisq(0.99,11),qchisq(0.01,11))
[1] 0.5989559 4.8499243

これ出せばおk

815 :132人目の素数さん:2006/12/29(金) 17:20:11
>>814
それを計算プロセスとして認めないだろうなあ。w
どこまでを基礎って言うかは立場によるけど理系なんだったらこのぐらい基礎だよな。

816 :811:2006/12/29(金) 17:47:15
>>812
パソコンで打ち込むのは初めてなもので、そういった書体を知りませんでした。

>>815
文系上がりの経済学部です

817 :132人目の素数さん:2006/12/29(金) 23:36:45
>>816
書体っていうか、違う文字だけど・・・?
まあ、テキストの「母分散の区間推定(母平均が未知の場合)」
みたいなところに載ってるよ。

818 :132人目の素数さん:2006/12/30(土) 00:20:50
>>816
経済なら基礎ではないな。少しの応用だけど。
817のいうような節が教科書にあるならそれだけだ。
見返す気なら自分で勉強してくれ。
ないならそれをカバーしていない教科書を使っているわけで
確かに嫌がらせ以外の何者でもないな。

819 :811:2006/12/30(土) 01:25:19
>>818
テキストは始めから使用していません。
教授の説明と配布プリントのみの予定でしたが、こういう展開で苦労しています。

820 :132人目の素数さん:2006/12/30(土) 03:32:24
あれ・・・母分散の区間推定って、正規母集団の仮定はいらなかったっけ?
つまり、 S^2=(1/n)倍X_i - E}^2 (Eは標本平均)で、
Xが分散σの任意の分布に従うとき、n*S^2/σ^2  は χ^2_(n-1) に従う?

821 :132人目の素数さん:2006/12/30(土) 09:14:21
>>820
そんなことあない。
教科書では正規分布に従うことが暗黙の了解で問題文から欠落してるだけでしょ。

それにしてもテキストがないとは古風この上ないな。
配布プリントに「分散の信頼区間」という文字は出てこないんだろうな…。
「平均の信頼区間」を習ったのなら応用ではあるが、自分で本を探して
解いてくる学生は文系ではおらんやろ。そもそもχ^2(カイ2乗)分布は
習ったんかね?

822 :811:2006/12/30(土) 13:56:41
>>821
いえ、そういう数式っぽい事は一切。。。
最初の講義からいきなり専門用語っぽいのを連発して訳分からないという状況でしたし、
終始「俺はすごいんだ」的な話ばかりでまともに授業が進まない時もありました。


823 :132人目の素数さん:2006/12/30(土) 16:42:28
そんな旧態依然な…。
授業評価とかないんか。あったら最悪やろうに。

824 :132人目の素数さん:2006/12/30(土) 16:44:06
>>822
>>810です。なんか大変な先生に捕まったね。オレは文系、心理学専攻だったけど、数学の先生が
講義していた。自慢話は一切なかったね。淡々と講義していたよ。こちらは淡々とチンプンカンプン
になりそうだったけど、学生寮に住んでいたので、理系の連中に馬鹿にされながら質問責め…、
そして実践的に学んだ。
で、心理学専攻のバイブル的なものになったのは
岩原信九郎 著 『教育と心理のための推計学』 日本文化科学社
1964年の発行で、こちらの年齢がわかるけど、やはり便利。ある生
物学系の人に教えたら「黙って開けばピタリと当たる」と喜ばれまし
た。古本で入手できると思います。アマゾンなんかで検索してください。



825 :132人目の素数さん:2006/12/30(土) 18:30:24
まぁ、「文系」を免罪符にせず、まじめに教科書読め。

826 :132人目の素数さん:2006/12/30(土) 19:25:14
テキストないって書いてあるっしょ

827 :132人目の素数さん:2006/12/30(土) 19:35:43
自分でテキスト選ぶだけ

828 :132人目の素数さん:2006/12/31(日) 03:54:34
文系の学生って高校で統計習わないんだっけ?

829 :132人目の素数さん:2006/12/31(日) 12:50:59
>>828
理系でも順列組み合わせ止まりで、統計なんて勉強しないも同然だけどな

830 :132人目の素数さん:2006/12/31(日) 19:51:41
しばらく前まで確率・統計という高校教科書があって、検定・推定まで
扱ってたんだが・・・
いつの間になくなったんだ?

831 :132人目の素数さん:2006/12/31(日) 20:08:23
↓うるせーんだよ
↓このスレを見ている人はこんなスレも見ています。(ver 0.20)

832 :132人目の素数さん:2007/01/01(月) 00:07:43
>>829
それマジ? 面白いのに勿体ないね。
実用との結びつきといい確率的なものの考え方といい、
早いうちに触れておいた方がいいのにね。
俺は確率・統計世代で区間推定や検定までやった。

833 :829:2007/01/01(月) 00:33:37
勉強しないも同然と書いたのは入試にでないから。
数学B (「統計とコンピュータ」と「数値計算とコンピュータ」を除く)
とか
数学C (「確率分布」と「統計処理」を除く)
ってしている大学が多いから。

834 :132人目の素数さん:2007/01/02(火) 15:56:54
質問です
実験から、A 315 B 101 C 108 D 32 計 556 の結果が得られた。
A,B,C,Dは9:3:3:1の割合になることが理論的に知られている。
この場合、この比率から、理論値を求めるにはどうすればいいんですか?
Dの32を1として、Aならば32*9の288と求めればいいのですか?
どなたか教えてください。

835 :132人目の素数さん:2007/01/02(火) 21:07:47
……なんというか、ゆとり教育ここに極まれり、という感が。小学生以下の理解力。

836 :132人目の素数さん:2007/01/03(水) 00:23:49
>>834の質問の意味がまだわからないが
556*9/16、556*3/16、556*3/16、556*1/16
が理論値じゃないのか?

>実験から、A 315 B 101 C 108 D 32 計 556 の結果が得られた。
というのは?赤い赤いニシン?ということでいいのか?





837 :132人目の素数さん:2007/01/03(水) 01:01:19
>>834
この問題には続きがあるでしょ??

「では、この実験で得られたA, B, C, Dの比率は理論的な比率と異なると言えるか??」
とかなんとか??
>>8.36さんのおっしゃるとおり!!>>834さん、理由はわかるよね。


838 :132人目の素数さん:2007/01/03(水) 01:02:49
>>837です。
>>8.36」さんではなくて、「>>836」さんの間違いでした。ごめんなさい。

839 :アイザック・ニュートン ファンs.s. ◆4H8ru750VY :2007/01/03(水) 19:58:25
ラプラスは、統計にくわしかったかな…。

840 :132人目の素数さん:2007/01/04(木) 18:52:29
問題です!皆さんの考えを教えてください。
@部分調整モデルを用いて分析することが望ましい現象をその理由とともに述べよ。
A社会現象の中で操作変数を用いてその因果関係が推定できるものを挙げよ。
なおその操作変数を選んだ理由を記せ。

841 :132人目の素数さん:2007/01/04(木) 20:38:07
レポートは自分でやんなさい。

842 :132人目の素数さん:2007/01/04(木) 21:02:11
調べても全くわからないんです><

843 :132人目の素数さん:2007/01/04(木) 23:20:24
質問です。
統計学を学んだ経験はないので、もし
ここで質問すべき内容でなければスルーしてください。

例えば、
A町とB町、それぞれ人口1000人ずつであったとします。
その内、
A町には10人、サッカー部に所属している中学生がいます。
B町には60人、サッカー部に所属している中学生がいます。

このことだけを見て
「B町の方がA町に比べて、『中学生のサッカー』は盛んなのだ!」
などと言ってる人がいたら当然、
「そもそもA町とB町にはそれぞれ何人の中学生が住んでるの?」
というツッコミを受けますよね?
(A町に10人しかいない中学生が全員サッカーをしてるかも知れないし、
B町には300人の中学生がいるのかも知れないので)


この場合、
 ・ 各町の全住民の中での中学生の人数
もしくは
 ・ 各町の全人口に対する中学生の人数の割合
を何と呼べばいいのか教えていただけないでしょうか。
どうかよろしくお願いします。

844 :132人目の素数さん:2007/01/05(金) 03:41:04
統計と関係ないけど、
その例だったら断然B町の方が盛んだと言って間違いないと思う。
なぜならサッカーは1チームに11人必要……。

845 :132人目の素数さん:2007/01/06(土) 02:32:42
正規分布に従う母集団から、標本(x) を取り出したところ、次のような結果を得た。

x 161 163 161 164 160 162 163

i. 平均と分散について、点推定を行いなさい

まったくわかりません・・・だれか助けてください。

846 :132人目の素数さん:2007/01/06(土) 04:28:20
サッカーがサッカーン

>>845
> sd(c(161,163,161,164,160,162,163))
[1] 1.414214
> mean(161,163,161,164,160,162,163)
[1] 161

但しこれは不偏分散な。
求める分散が母分散なのか標本分散なのかわからんが。

847 :132人目の素数さん:2007/01/06(土) 04:57:58
ああ点推定だから求めるのは母分散な。
あと
>>843は少なくとも「盛ん」の定義をしないと誰にもどうしようもないと思うが。
「盛ん」の定義を統計学に求めているのであれば、それは筋違い。

848 :235:2007/01/06(土) 11:21:21
xがパラメータλのポアソン分布に従うとき<1/x+1>を求めたいんですが
どうすればいいんですか?

849 :132人目の素数さん:2007/01/06(土) 11:25:42

<1/(x+1)>です

850 :132人目の素数さん:2007/01/06(土) 12:39:55
>>847
母分散を点推定するのだから標本分散でいいんじゃね?

851 :132人目の素数さん:2007/01/06(土) 12:56:01
>>846ありがとうございます
自分なりにやってみて平均は161 163 161 164 160 162 163
を全部たして7で割って162になったんですけどこれってだめなんですか?
あと分散は N−1 で割ればいいのか N でわればいいのかよくわからないんですが
母分散のときだとどっちなんですか?


852 :132人目の素数さん:2007/01/06(土) 15:41:17
>>851
ごめんごめん。平均の推定はそのやり方でおk。162であってるよ。
標本から母分散を推定するならN-1で割る。

>>850
なんでやねん

853 :132人目の素数さん:2007/01/06(土) 16:09:42
>>852
ごめん、ごめん。標本不偏分散ね。母分散っていうと真値みたいだから。

854 :132人目の素数さん:2007/01/06(土) 16:38:45
推定するのは母分散で求めるのは不偏分散ってことだな。

標本から求まる標本分散は推定値ではなく真値である。
よって点推定しろといってるその問題は母分散の推定であり不偏分散を求めろってことだ。

って、明らかにそんな小難しく考えさせる問題じゃないだろ。

855 :132人目の素数さん:2007/01/06(土) 16:54:30
そうだろな。ちなみに求めるのは標準偏差でなく分散だから
> var(c(161,163,161,164,160,162,163))
[1] 2
だけどな。


856 :132人目の素数さん:2007/01/06(土) 16:59:30
ほんとだな
オレ、分散より標準偏差の方がスキなんで、つい・・・

結局>>846は両方間違ってるじゃね〜か

857 :132人目の素数さん:2007/01/07(日) 00:28:44
素人なのですが、どうか助けて下さいm(__)mお願いします
T検定が分からなくて困っています。
テストA、テストBの両方を複数の被験者に実施し、
テストAの点数が高かった群のテストBの点数と、
テストAの点数が低くかった群のテストBの点数を比べたいのですが、
3つのうちどのT検定を使って良いか調べてもわかりません。
どうかアドバイスをお願いします

858 :132人目の素数さん:2007/01/07(日) 01:10:28
>>857
3つってなんだ?単に2群間比較のt検定に見えるのだが。

859 :132人目の素数さん:2007/01/07(日) 01:43:10
>>585
ありがとうございますm(__)m
エクセルの分析ツールからT検定に行くと、
三種類のT検定が出てきます

860 :843:2007/01/07(日) 03:07:16
>>843です。例がまずかったようです。すみません。
「盛んさ」という漠然としたものを統計で示そうとしてるわけじゃないです。

住民を「野菜」に、サッカー部の中学生を「腐ったカボチャ」に
置き換えていただいてもいいと思うのですがとにかく、
2つの独立してない条件にあてはまるモノのかず(or割合)を
数えたとき、先にあてはめた方の条件にあてはまるモノのかず(or割合)を
どう表現すればいいかわからないんです。

しつこくすみませんがよろしくお願いします。

861 :132人目の素数さん:2007/01/07(日) 10:25:53
>>859
そういうことは初めに書いとかな。
俺の言った方法はそういう意味では2番目。

862 :132人目の素数さん:2007/01/07(日) 11:35:29
>>861
本当にありがとうございました。
情報不足でご迷惑をおかけしました。
本当に助かりましたm(__)m

863 :132人目の素数さん:2007/01/07(日) 13:28:44
統計学の勉強を始めて日が浅い者です。
あれこれ調べたのですが、分からないので質問させてください。
正規分布を基礎にした学業成績の5段階評価を40人学級で行った場合、計算した結果、合計が41人になりました。
この41人を「3」のレベルで人数調整しろという指示があるのですが、よく意味が分かりません。
どなたか意味を教えていただけませんか。それか、参考になるサイトを教えていただければ幸いです。


864 :132人目の素数さん:2007/01/07(日) 15:04:36
>>863
「3」のレベルを一人少なくしろってことじゃないの?

865 :132人目の素数さん:2007/01/07(日) 16:48:10
>>864
orzどう考えてもそうですね。
本当にありがとうございました。

866 :132人目の素数さん:2007/01/07(日) 19:03:41
統計学は形而上学だって言われたのですが、本当ですか?
形而上学って何ですか?

867 :132人目の素数さん:2007/01/07(日) 21:00:05
>>866
国語辞典も持っていないのか。形而下の反対だよ!

868 :132人目の素数さん:2007/01/07(日) 21:14:25
馬鹿はレスしないでください。

869 :132人目の素数さん:2007/01/08(月) 00:04:19
誰が言ったのか知らんけど、例えば観察値を生み出すような確率分布は、ある意味形而上学的ではある。
ただそんなこと言い出すと、凡そどんな学問分野でも、ある意味形而上学的ではある。

で?

870 :馬鹿:2007/01/08(月) 00:55:44
っていうか、どんな学問も形而上的要素と形而下的要素の両方を持ち合わせている。

871 :132人目の素数さん:2007/01/08(月) 08:48:31
「アインシュタインの相対性理論は正しい」という命題は単純で、誰でも
容易に理解できる。 実験検証すれば、白黒がつくからです。実際、
巨額のお金を投入した実験検証が今でも行なわれています。
ところが、「統計学は正しい」という命題は単純ではありません。
「統計学の実験検証」などという言葉を聞いたことがありません。
「非常に役に立つこと」を認めない人はいないでしょうが。
こんなところが、「統計学は形而上学」という人がいる理由だと思いま
すが。どうでしょうか?


872 :132人目の素数さん:2007/01/08(月) 08:50:30
形而上学の定義がおかしい

873 :132人目の素数さん:2007/01/08(月) 09:28:51
「形而上学」を国語辞典で調べても難しいことが書いてあって
何だかわかりません。
唯一、統計力学の本
  http://www.rinst.org/   
Second introduction to Statistical mechanics
(Japanese version, updated Dec 18, 2006)
の6ページの脚注3で
「実験で、白黒が決まらないことが形而上学」
と書いてあり、これではわかった気分になりました。
もっと明快な定義をご存知なら教えてください。


874 :馬鹿:2007/01/08(月) 11:19:31
まだこの話題をやっているのか。
イメージをつかむための不正確だが分かりやすい定義だと
形而上学=抽象的で形がないものを対象にした学問(真理探究型)
形而下学=具体的で実際的な学問(実用型)
形而上学は具体的でないから実験で白黒つかない。

875 :132人目の素数さん:2007/01/08(月) 12:11:08
形而上学の定義がおかしい。

876 :132人目の素数さん:2007/01/08(月) 14:29:50
「統計学は正しい」という命題が単純でないことが
わかっただけでも、大収穫でした。
皆様方のご親切な助言に感謝いたします
ありがとうございました。


877 :132人目の素数さん :2007/01/08(月) 19:47:50
ある大都会の警察が、夜に交通事故で死亡した歩行者の服装を調べたところ、
犠牲者のうち、およそ4/5は黒っぽい服を着ており、1/5が明るい色の服装だった

この調査から、日が暮れたら歩行者は白っぽい服装をするか手に何か白っぽい
物を持って、ドライバーが簡単に見分けられるようにすれば交通事故にあう確率も
少なくなる、と云うことができる

さてこの記事が述べている結論は正しいでしょうか?統計的観点から考えを述べよ

これをどういう風に答えれば良いのかわかりません
だれかご教授願えないでしょうか

878 :132人目の素数さん:2007/01/08(月) 19:58:42
市場に出回ってる服の比率が黒っぽい服対白っぽい服で1:1だったらそうだろうね。
要するに根拠がちょっと足りないかな。

まあ4倍も違わないだろう、せいぜい1.5倍とか2倍くらいだろう、とか
そういうことが明らかなら良いんだろうけど。

879 :132人目の素数さん:2007/01/08(月) 20:07:32
>>878
根拠と具体的な数字が足りないんですか・・・

880 :132人目の素数さん:2007/01/08(月) 20:34:05
>>879
根拠はともかく具体的な数字は自分で考えるんでね?
元の文章でも調査が5人なのか50人なのか500人なのかも
分からないんだし。

881 :132人目の素数さん:2007/01/08(月) 20:43:38
>>877
結論:正しいとはいえない
事故に遭わない対照の白黒比と比較して初めて検討できる

882 :132人目の素数さん:2007/01/08(月) 21:13:21
>>880
>>881
わかりました。意見を参考にまた考えてみたいと思います
ありがとうございました

883 :796:2007/01/09(火) 19:30:58
正月はゆっくりさせていただきました

>>799
言わんとすることはわかるのですが、なぜ
・【計算方法1】の分散が (σ^2(h^2+w^2) + σ^4)/N
・【計算方法2】の分散が (σ^2(h^2+w^2) + σ^4/N)/N
になるのかがどうしてもわかりません。
出典(参考書)があればお教えいただければ幸いです。

884 :796:2007/01/09(火) 19:35:09
自己レス1です

>>796
>>797
>>801
この本↓
[2] http://amazon.co.jp/o/ASIN/4762263796/
http://www.d4.dion.ne.jp/~zen/DATA/chap4/chap4.html
の4.3に何か情報があるのかもしれないと思い、
先日この本を購入したのですが、旧版だったため
4.3がありませんでした。改訂版になっていたとは・・・orz

[2]の本でも
[1] http://amazon.co.jp/o/ASIN/480790521X/
と同様に誤差伝播の法則(誤差の伝播に関する規則)は
(1) σ_A = μ_h・μ_w・√[ (σ_h/μ_h)^2 + (σ_w/μ_w)^2 ]
です。

885 :796:2007/01/09(火) 19:35:48
自己レス2です

>>796
>>797
>>801
いくつかの前提を設けて極論を考えてみます。
(a) hとwは独立(これはまあ言わなくても・・・)
(b) 母平均=標本平均(Nが十分に大きい) → μ_hとμ_wは母平均
(c) 母分散=標本分散(Nが十分に大きい) → (σ_h)^2と(σ_w)^2は母分散

・【計算方法1】の標準偏差σ_1
標本の総数がNの場合の標準偏差をσ_Aとすると
標本の総数はM・Nになるが、σ_1 = σ_A

・【計算方法2】の標準偏差σ_2
標本の総数がNの場合の平均μ_hとμ_wは母平均なので、
ランダム誤差が除かれており、μ_hとμ_wは真の値とみなせる。
したがってσ_2 = 0
---

この結果を見ると比較自体がナンセンスかもしれません。
ついでに(b)と(c)の前提を除くとMとNに複雑に依存しそうです。
どなたかお力を・・・

886 :132人目の素数さん:2007/01/09(火) 20:16:23
>>883
単に紙と鉛筆で計算しただけです。独立なものはすぐ消えるので分散の計算は
それほど大変ではないはず。

ところで元の>>796では繰り返し数Nしか出てこないのに、>>797ではMというのも
出てきます。この関係がよく分かりません。上記の計算は>>796での話です。

887 :132人目の素数さん:2007/01/09(火) 22:45:12
カイ二乗検定について質問です。

YES/NOで回答する質問×3群の2×3のクロス表についてカイ二乗検定する

というのは意味があるのでしょうか?
YES/NOで回答する質問を2水準に分けてカイ二乗すること自体ナンセンスのような気がしてなりません。

例えば
  A B
YES 5 0
NO 95 100
これでもカイ二乗検定をすると有意差でますけど、
この質問に対する回答をAとBで比較したときに
「AはYESと答える」
ということを示すものではないですよね?

STARで検定したときに残差分析までやってくれるのですが
「 実測値と残差分析の結果 」
----------------
5▲0▽
95▽100▲
----------------
(▲有意に多い、▽有意に少ない、p<.05)

たかだか5人の回答で「有意に多い」って言われてもって感じで…。

こういう分析しろと言われたのですがなんか変な気がしたけど論破できなかったのでぜひお力を貸してください。

888 :132人目の素数さん:2007/01/09(火) 23:58:24
>>887
期待度数がYESと答えたグループで期待度数が5以下(3以下という説もあり)になるので、
単純に独立性の検定(カイ2乗検定)を行わない方がよいでしょう。

Fisherの正確確率検定(別名「Fisherの直接確率法」)を使って検定しましょう。
詳しくは、
ttp://aoki2.si.gunma-u.ac.jp/lecture/Cross/cross.html
ttp://aoki2.si.gunma-u.ac.jp/lecture/Cross/Fisher.html

計算は以下のサイトでできます。

ttp://aoki2.si.gunma-u.ac.jp/exact/fisher/getpar.html

まあ、がんがれや


889 :132人目の素数さん:2007/01/10(水) 00:11:32
>>888です。一部訂正します。
>期待度数がYESと答えたグループで期待度数が5以下(3以下という説もあり)になるので

「YESと答えたグループで期待度数が5以下になるので」
とします。「(3以下という説もあり)」を削除します。ごめんなさい。
更に詳しい解説は

ttp://aoki2.si.gunma-u.ac.jp/lecture/Cross/warning.html


890 :132人目の素数さん:2007/01/10(水) 01:10:09
>>887
>YES/NOで回答する質問を2水準に分けてカイ二乗すること自体ナンセンス
カイ自乗検定は行の期待値に関する比率を元にしているから列が、
887でいうAとBがそれぞれ100で固定されるということになるなら、
YESが変動するとNOも逆比例して変動する。
だからたしかにカイ自乗を用いるのはナンセンス。

891 :132人目の素数さん:2007/01/10(水) 02:22:06
       _
正規変数からのxの分布に関する質問です。
あるメーカーが圧迫強度がμ、標準偏差σの正規分布に従うこと
を分かっていたとする。
新技術の改良をし、圧迫強度を調べて標準偏差を出す。
       _
それぞれμ、σ、xの値は分かっていて、この改良技術が平均圧迫強度を
低めているかどうかを調べるにはどうしたら良いのでしょうか。
どなたらよろしかったらお力添えをしていただけると助かります。

892 :132人目の素数さん:2007/01/10(水) 06:29:50
>>890
あのー、元々カイ二乗検定って行も列も周辺固定なのですが、…。
(行と列の違いなんて入れ替えればいいだけだし)

893 :132人目の素数さん:2007/01/10(水) 09:52:58
>>887の言いたいことがわかった気がする。
>>888の期待度数の話はひとまず置いておかせてください。
以下はあくまで極端な例として書いてみます。
例1
  A B
YES 5 0
NO 95 100

例2
  A B
YES 100 0
NO 0 100

上の二つのクロスデータをカイ二乗すると両方とも有意になる。
残差分析をすると、共に
  A B
YES ▲ ▽
NO ▽ ▲

こういう結果になるけど、
AのYESが有意に多いと言っても例1の5人と例2の100人では明らかに人数が違うじゃないかと。

A群の5人で有意だからA群はYESと答える傾向にある
A群の100人で有意だからA群はYESと答える傾向にある

確かに5人で有意って解釈しずらいだろうね。

で、言ってる意味はわかったけどこれをどうすればいいのかは俺にもわかりません。
誰か続きお願い。

894 :132人目の素数さん:2007/01/10(水) 10:23:23
>>892 さん
>>890 は行の自由度が1ということを問題にしていると思われます
つまり >>887 さんの例は事実上
A B
5 0
というデータ
一方カイ2乗分析(分散分析)をやるには「ランダムにばらついている
と考えられる数字」が必要(ノイズに比べて 5 vs 0 がシグナルと
思えるかどうかを問題にするために統計学を持ち込むから)
>>887 さんの例だと比較すべき「ノイズ」がありません


895 :796:2007/01/10(水) 11:11:20
>>886
問題の整理が解への近道かもしれません。
ということで問題を整理してみます。

---問題ここから
計測したい物理量:ある長方形の面積A
実測される物理量:その長方形の縦の長さh、横の長さw

繰り返し測定を行ない、その結果として
h_k、w_k(k = 1, 2, ..., N・M)が得られる。
これらの実測値には誤差としてランダム誤差のみ
が含まれているものとする。

(1) A_1_k = h_k・w_k
(2) A_2_j = (Σh_i)/N・(Σw_i)/N

ここで、i、j、kは以下のとおり。
i = 1, 2, ..., N
j = 1, 2, ..., M
k = 1, 2, ..., N・M

A_1_kとA_2_jではどちらが標準偏差が小さくなるといえるのか?
---問題ここまで

ということで問題を整理してみたら、
答えは当然A_2_jであり(ですよね?)、
比較自体がナンセンスであることがわかりました。。。orz
お付き合いいただいた798様、799様、800様
本当にありがとうございました!
そしてつまらないことにつき合わせてしまって
申し訳ありませんでした。深く深くお詫びいたします。<(_ _)>

896 :796:2007/01/10(水) 11:13:01
>>895
しかし計測技術については、ひとつの疑問が残りました。

適当なNと、式(2)の計算方法を使えば、
測定値Aの標準偏差(≒1/精度)を小さくすることができるので、
ある意味「みせかけの精度」を良くすることができてしまいます。
まあこれについてはこのスレとは関係ないので、
興味なければスルーしてください。

897 :助けて下さい:2007/01/10(水) 11:54:16
どうしても解けない問題があるんですが誰か教えて下さい。
問題は↓
V(X−Y)=V(X)ーV(Y)これを証明しろというものです。V(X)はXの分散です。

898 :132人目の素数さん:2007/01/10(水) 12:38:13
>>897
分散の定義式にXとYをあてはめればすぐですよ。

899 :助けてください:2007/01/10(水) 16:15:19
897ですが計算過程とかもできれば書いて欲しいのですが…

900 :教えて下さい:2007/01/10(水) 18:59:36
確率変数Xが標準正規分布N(0,1)に従う時、以下の確率変数Yが従う確率密度関数を求めよ。
(1)Y=aX+b(a、bは定数)
(2)Y=X^2 

901 :132人目の素数さん:2007/01/11(木) 00:01:17
>>894
何か話がかみ合ってないな。
カイ二乗検定というのは分割表の独立性の検定のではないの?
それならそれ自体が自由度1なんだけど。

>>893
2つのデータの有意確率は異なると思いますが…。

902 :132人目の素数さん:2007/01/11(木) 00:07:48
>>897
V(X)+V(Y)-COV(XY)だろ
それじゃあ場合によっては分散が負になっちゃうじゃん

>>900
(1)N(b,a)
(2)未定義
じゃね?

903 :132人目の素数さん:2007/01/11(木) 16:53:28
多変量で、多元グラフ(3次元以上)をかけるやつない?

904 :132人目の素数さん:2007/01/11(木) 18:34:21
Interobserver and intraobserver variability (検者間と検者内のバラツキ)
を導く統計解析は何ですか?
Linear regression ではダメですか?
Bland & Altman 以外で何か教えてください。

905 :132人目の素数さん:2007/01/12(金) 11:19:34
>>900
(2) カイ二乗分布

906 :132人目の素数さん:2007/01/12(金) 14:55:35
あるn次元の特徴量をもつデータから、一番データに影響を与えていない
特徴量を抽出する手法を探しています。

自分が考えたのは主成分分析を利用して、第一主成分だけを見て寄与率が
閾値以下の特徴量を抽出したらいいのではないかと考えています。

自分の知識ですとこれが限界なので、もっといい方法があればご教授願います。

907 :132人目の素数さん:2007/01/12(金) 17:19:27
2項分布と正規分布とポアッソン分布でもとめた確率がなぜ厳密には異なるのかわかりひといないっすか?
教えてください。

908 :132人目の素数さん:2007/01/12(金) 17:49:19
世の中にそのような分布をするものは存在しないから

909 :132人目の素数さん:2007/01/12(金) 18:05:31
>>907
異なるものだから、異なる。

定義域、離散分布・連続分布の性質からも異なることが分かる。


910 :132人目の素数さん:2007/01/12(金) 21:58:29
>>906
データに影響を与えるとは何かというのがなければそれでいいんじゃね。
(具体的にデータに変化があるとか外れ値が出るとか)

911 :906:2007/01/13(土) 09:38:01
>>910
回答ありがとうございます。
しかし、先ほど確認したところ
「主成分分析は主成分として新たな基底を作成する際に全ての特徴量を用いていて、
寄与率が一定値以下だからといって、そのはじかれた特徴量f'nがデータに影響を
与えていないとは言えないし、そもそもはじかれた特徴量f'nは最初の特徴量fnとは別物」
とつっこまれました。

どうも主成分分析以外を使わなければなさそうなんですが、
こういったあるデータ群の特徴量を与えている順位付け?みたいなことを
行う手法はありますか?

何度もすいませんが、よろしくお願いいたします。

912 :132人目の素数さん:2007/01/13(土) 09:58:39
>>908, >>911
>「主成分分析は主成分として新たな基底を作成する際に全ての特徴量を用いていて、
>寄与率が一定値以下だからといって、そのはじかれた特徴量f'nがデータに影響を
>与えていないとは言えないし、そもそもはじかれた特徴量f'nは最初の特徴量fnとは別物」
>とつっこまれました。

主成分分析が多数の説明変数を単純化するために、ある種の合成変量を作り出す
手法だと言うことを指摘された訳ですね。合成変量で、その変量に研究者自身が命
名します。その命名次第で受ける印象や考察にバイアスがかかりますから注意する
必要がありますね。

すると、従属変数が計量データ(量的データ)すなおに多重回帰分析をして、偏回帰係
数が有意にならないものを除外するという手ではいかがでしょうか?

従属変数が質的データ(計数データ)の場合には、判別分析(多重判別分析)という手
ではどうでしょうか?

「ハヤシもあるでよ!!」(古っ)という声も聞こえてきそうですが…wwww


913 :132人目の素数さん:2007/01/13(土) 10:02:44
>>912です。

>>908, >>911 」のところは、アンカーつけ間違えました。>>908ではなくて、>>906でした。

>すると、従属変数が計量データ(量的データ)すなおに多重回帰分析をして、偏回帰係
>数が有意にならないものを除外するという手ではいかがでしょうか?

は意味不明ですね。以下のように訂正します。

>すると、従属変数が計量データ(量的データ)なら、すなおに多重回帰分析をして、偏回帰係
>数が有意にならないものを除外するという手ではいかがでしょうか?

914 :132人目の素数さん:2007/01/13(土) 10:15:45
>>913
従属変数があるならそうでしょうね。主成分分析をしているのでそんなものはないと
思ったんですけどね。

915 :132人目の素数さん:2007/01/13(土) 10:21:30
>>911
そもそもこの返事は>>906のアイデアの回答としては変ですね。
アイデアを「主成分そのものを特徴量とする。小さい主成分は切り捨て」
というように誤解されたようですね。そうでなければ特徴量は別物などという
言われ方はしないはず。寄与率という言葉を使ったのがまずかったのでしょう。
主成分の係数ですね。(寄与率というと主成分そのものの影響を図るものと
取られるのが普通でしょう。)

916 :132人目の素数さん:2007/01/13(土) 11:34:12
>>912-915
回答ありがとうございます。非常に参考になりました。

自分がやりたかったことは、「主成分分析のように全ての特徴量を利用した主成分
にどれだけ寄与しているか」ではなくて、
「f次元の特徴ベクトルそのものを利用する場合にどれを選択すべきか、
すなわち、どの特徴変数ならば削減しても影響が少ないか」
を選択する問題でした。

自分は、主成分分析の寄与率は、特徴変数そのものに対して順位付けを行う手法であると考えていたため
>>911のような指摘されたと思います。
主成分分析は、特徴ベクトルの全ての変数と相関係数行列を用いて
変量の個数を削減する手法という理解でよろしいでしょうか。

再度調べたところ、偏F値ならびにP値というものの存在を知ったのですが、
これをつかってできないかと思いますが、いかがでしょうか?(変数の増減に使うとあったので…)

偏F値やP値についてもう少し調べてみますが、この手法の可否につて回答をお願いいたします。


917 :916:2007/01/13(土) 11:47:44
追加です。
変数減少法という手法があるということを知りました。まさに自分のやりたいことに一番近いのでは
ないかと思いましたが、いかがでしょうか?
(参考:ttp://akimichi.homeunix.net/~emile/aki/html/medical/biostatistics/node58.htmlなど)

918 :132人目の素数さん:2007/01/13(土) 12:09:01
>>916-917
回答から察すると従属変数があるということでいいのですね?
それならば>>913さんのいうように回帰分析が普通でしょう。
(それならどうやって主成分分析をしたのだろう?説明変数のみで?
それともすべての変数を一緒にして?)

重回帰なら変数の選択は教科書にもある基本的なことですが、
その方法(変数減少法もその一つ)と選択規準が複数あり
指摘されたWebでは選択規準としてCpとAICと自由度調整済重相関係数の3つが
あがってますね。どれにしても何かのソフト(たとえばR)を使わないと
できません。


919 :132人目の素数さん:2007/01/13(土) 15:50:50
コイン投げのようなゲームを10人(番号1〜10が振り分けられている)で行う。

各自、それぞれ1枚ずつのチップを持っている。最初に1番と2番の人がゲームをして
負けた方がチップを【1枚】勝った方に渡す、勝った人【チップが2枚になっている】は
3番の人とゲームを行う。

【チップが無くなった人が負けとなる】最後に勝ち抜いてきた人は10番の人とゲームを
行い勝てば優勝である。このゲームでゲームをする順番によって優劣があるかどうかを
その理由とともに述べなさい



この問題は確立を計算していくことで解けると思うんですが、それ以外の解答方法(つまりその理由)はあるでしょうか?


920 :132人目の素数さん:2007/01/13(土) 16:15:38
>919
確立か。

921 :132人目の素数さん:2007/01/13(土) 20:51:20
>>914
ご指摘感謝。当方の不注意でしたね。>>906
>あるn次元の特徴量をもつデータから、一番データに影響を与えていない
>特徴量を抽出する手法を探しています。
という文で、従属変数があるものとばかり思ってしまいました。主成分分析では従属変数を
必要としませんね。




922 :132人目の素数さん:2007/01/14(日) 00:19:48
大数の法則と中心極限定理の関係が良くわかりません。

中心極限定理があるのなら大数の法則の存在する理由がないと思うのですが。

923 :132人目の素数さん:2007/01/14(日) 05:21:52
えええ。どうしてそう思うのか、きちんと説明してみ。

924 :132人目の素数さん:2007/01/14(日) 07:30:23
大数の法則には、弱と強があります。
確率論の本を見た方がいい。
収束の違いが理解できていないと難しいかもね。

925 :132人目の素数さん:2007/01/14(日) 14:04:45
質問ですが、 日本銀行は「公開市場操作」、「公定歩合操作」、「法定準備率操作」により、
物価水準(P)の安定を目指している。
公開市場操作、公定歩合操作、法定準備率操作ハイパワードマネー(H)、貨幣乗数(m)
貨幣供給量(M)、貨幣市場の均衡式、等を用いて、日銀の物価コントロールの仕組みを説明しなさい。
という問題わかりますか?

926 :132人目の素数さん:2007/01/14(日) 14:15:57
はい、わかります。

927 :132人目の素数さん:2007/01/14(日) 14:23:08
>>920
確率の間違いでした・・・アドバイスくれると助かります

928 :132人目の素数さん:2007/01/15(月) 12:37:24
>923
>924
反応どうもです。確かに質問の仕方が悪かったようです。

俺の頭の中で
中心極限定理は
標本平均と真の平均の誤差が正規分布に従う

正規分布の形は(μ,σ~2/√n)

つまりはnを大きくすれば真の平均に近づく可能性が高いといえる
(コレは大数の法則そのものではないですか?)

中心極限定理のなかに大数の法則が含まれている。つまりは
中心極限定理∋大数の法則
なのでは?
という理解になってしまっているのですが。

929 :132人目の素数さん:2007/01/15(月) 14:50:57
>>928
概収束、確率収束、分布収束と順に弱くなっていきます。
確率収束も定数に収束と、確率変数に収束があります。

中心極限定理が成り立たなくても、大数の法則は成立します。

強・弱とかの大数の法則の定義もあるので、例えば
伊藤 清 「確率論の基礎」(岩波)
でも見てください。

「中心極限定理のなかに大数の法則が含まれている」は
独別の場合に成立します。


930 :132人目の素数さん:2007/01/15(月) 15:53:16
アクチュアリー知ってます?

931 :916:2007/01/15(月) 18:27:23
>>912-915, 918. 921
皆様、回答本当にありがとうございます。

>>921さんのおっしゃるとおり、今回扱っているデータには従属変数はありません。
というのも、独立変数X1,X2…に対する従属変数Yが1変数ではなく、複数だからです。

この従属変数群を表すためにはどの独立変数が削減できるか、を実現する手法を調べていました。

言葉の定義などが曖昧で回答してくださった皆様に混乱を招いてしまったことをお詫び申し上げます。

あらためておたずねしますが、このような問題を解く手法はどういったものがあるでしょうか?
それとも、従属変数Yを1つに絞らなければそもそも解けないのでしょうか?

何度も申し訳ありませんが、回答をよろしくお願いいたします。

932 :132人目の素数さん:2007/01/15(月) 20:07:15
誰か>>920お願いします

933 :132人目の素数さん:2007/01/15(月) 23:15:22
>929
どうもありがとうございます。
どうやら確率論の本が初心者向けには詳しく書いていないようなので
指摘された本を読んでみます。

934 :132人目の素数さん:2007/01/16(火) 23:10:13
次のような10個の騒音値(dB)を得た。
66 65 62 62 60 58 64 57 56 60
そして、これらデータ(標本)の母集団を無限母集団だと考え、調査に堪えられる標本数を決めたい。
まずこのデータの平均値=61dBと標準誤差=1.08dBより、本地点での簿平均の信頼区間は、信頼水準95%(k=1.96)で61±2.12dBとなる。
また精度を1dB以下にしたい場合
標本数は(  517  )以上必要となる。
         ↑
どなたかこの標本数の出し方教えてください。

935 :132人目の素数さん:2007/01/17(水) 00:24:36
>>931
質問はちゃんとしようね、だいぶ状況が変わっちゃったよ…。

ということで(X1,...,Xn) => (Y1,...,Ym)という状況でOK?
そういうことなら普通の分析は正準相関分析。
ただし、正準相関分析での変数選択というのは聞いたことがない。

簡単にできそうな別の方法としては主成分重回帰分析。
(Y1,...,Ym)の方で主成分分析して第1主成分を求めておき、
その標本スコアに対して(X1,...,Xn)から重回帰分析を行う。
これだと普通の変数選択の方法が使える。


936 :助けてください:2007/01/17(水) 00:45:53
ある大都会の警察が、夜に交通事故で死亡した歩行者の服装を調べたところ、
犠牲者のうち、およそ4/5は黒っぽい服を着ており、1/5が明るい色の服装だった

この調査から、日が暮れたら歩行者は白っぽい服装をするか手に何か白っぽい
物を持って、ドライバーが簡単に見分けられるようにすれば交通事故にあう確率も
少なくなる、と云うことができる

さてこの記事が述べている結論は正しいでしょうか?統計的観点から考えを述べよ 。

どうしても解けないので誰か教えてください。


937 :132人目の素数さん:2007/01/17(水) 04:57:33
>>936
普通に「夜の歩行者全体に占める黒っぽい服装の割合が分からないとなんともいえない」だな。
その上で、サンプル数の問題だな。



938 :132人目の素数さん:2007/01/17(水) 06:59:31
>>877, 936
同一人物なのかお友達なのか

939 :132人目の素数さん:2007/01/17(水) 07:40:19
同一人物だったら二度も書き込まないと思うぞ

>>936
上の方見ろ


940 :132人目の素数さん:2007/01/17(水) 08:13:08
>>877みたいにアドバイスを欲するか
>>936みたいにただ答えを求めるだけか

統計云々に関係ありませんが、すごい落差ですね

941 :132人目の素数さん:2007/01/17(水) 15:15:43
卒論で困っています。教えて頂けないでしょうか?

雑談で1恋愛について 2仕事について 3趣味について 4好きな食べ物について
の話題が出たときにA同調する B批判する Cさらに情報を求める D違う話をする
というどれかの反応があったとします。(たとえ話です)

このようなデータを300件くらいとって「恋愛の話は同調しやすいが、仕事の話に
なると話題がかわりやすい」というような1〜4とA〜Dの関連を見たいのですが
どのような手法を使えばいいのでしょうか?

942 :132人目の素数さん:2007/01/17(水) 15:29:35
それを調べるのも卒論のうち…なーんて。

943 :132人目の素数さん:2007/01/17(水) 18:41:32
いや、卒論のうちだろ。聞くにしてもなんで指導教官に聞かないのか謎。
俺は理系だったから文系の卒論はよくわからんが、毎週打ち合わせしたりしないのか?

しかし今頃そんなこと言ってるようじゃダメなんじゃないのかw
研究で必要ならとっくに統計の勉強くらい終わってなきゃ。

944 :931:2007/01/18(木) 23:05:38
>>935
回答ありがとうございます。
主成分分析の結果を従属変数にする、と言う方法が今自分が扱おうとしている
データの解析にうまくあいそうですので、早速この手法を試したいと思います。

本当にありがとうございました。

945 :132人目の素数さん:2007/01/18(木) 23:36:37
SASをやりたいのですが質問です

いくらで変えますか?
どこで変えますか?

ぐぐっても、わけわからんページばかり表示され探せませんでした。

946 :132人目の素数さん:2007/01/19(金) 07:46:45
>>945
SAS Institute Japan に電話して聞け。
http://www.sas.com/offices/asiapacific/japan/corporate/contact.html

947 :132人目の素数さん:2007/01/19(金) 21:16:31
質問です。
『漸近分散』と『分散の極限』とはどう違うのでしょうか?
同じものと思ったのですが、別物のようですね。
誰かよろしくおねがいします。

948 :132人目の素数さん:2007/01/20(土) 11:57:40
漸近分散は、統計量の収束速度(例えば、正規分布の場合なら、標本数の
平方根の逆数)で標準化されてる。収束のオーダーが同じ統計量の有効性
を比べたりするときに使う量。


949 :132人目の素数さん:2007/01/20(土) 12:59:15
質問です。
アンケートを実施したのですが、
少数のサンプルの統計の結果の傾向と、
多数のサンプルの統計の結果の傾向が、
ほぼ同じであると考えられる場合、
「その少数のサンプルは、母集団の縮図である」
「従って、小数のサンプルで取れたデータは信頼性が高い」
というような妥当性を証明する方法ってあるのでしょうか?


950 :132人目の素数さん:2007/01/20(土) 15:34:36
保守。

951 :132人目の素数さん:2007/01/20(土) 20:47:00
>>949
状況がよくわからんな。
多数のサンプルがあるんならそちらの方が信頼できるやろ?
なんで少数の方を使うんや?

952 :132人目の素数さん:2007/01/20(土) 22:34:20
>>951
少数で取った情報を、多数で取っていない場合なんです。
つまり、

・少数と多数の傾向が似通っているので、少数の信頼度が高い(母集団の縮図と言える)。
・よって多数では取っていないデータも、信頼できる

、と言うことが言えるのかどうか、
という感じです。


953 :132人目の素数さん:2007/01/20(土) 23:29:52
>>952
基本的にサンプリング方法が妥当かどうか自体を検討すべきやろう。
その比較によって逆にサンプリング方法がおかしいことは分かっても
正当だと言うことを保証するのは無理ちゃうか。


954 :132人目の素数さん:2007/01/21(日) 02:54:17
>>952、953
サンプリング方法が妥当かどうか自体を検討すべき、というのは正しい。
そして、統計量を不偏性(バイアス)と分散の両面からチェックする。

母集団の属性情報の統計と、少数サンプルの属性情報があれば、ある程度、
誤差を小さくすることはできる。例えば、母集団がA,B,Cの3つのグループ
に3等分されていて、各グループ毎に調べたい項目の値が大きく異なる場合、
A,B,Cから1つづつサンプリングすれば、母集団からランダムに3つサンプリ
ングするよりは分散が小さくなる。

参考:割り当て抽出、層別抽出


955 :132人目の素数さん:2007/01/21(日) 11:35:42
国別の人口密度と人口増加率のデータを使って散布図を書かねばならないのですが
この場合人口密度は対数を使ったデータを使ってやらねばならないのでしょうか

956 :132人目の素数さん:2007/01/21(日) 17:29:02
>>955
時と場合による。
散布図だけなら趣味の問題。
回帰分析とかがしたいなら、誤差項の仮定を満たすように変換することを勧めるが。

957 :132人目の素数さん:2007/01/21(日) 18:13:35
>>956
人口増加率と、対数をとった人口密度で作った場合と、
人口増加率と人口密度で作った場合にかわってくるので、どちらを使えば良いのか分からないんです・・・

958 :132人目の素数さん:2007/01/21(日) 20:55:43
次のデータはあるホテルで5種類の洗剤ABCDEを用いてシーツを7枚ずつ洗濯した結果、汚れが落ちた割合である。
1、各洗剤の効果に差があるか分散分析で検討しなさい
2、優位な場合には書く水準の信頼区間を求めなさい
3、最適な洗剤に対する母平均とその信頼区間を求めなさい。ただし、数値の大きいほうが望ましい。

因子A       データXij        合計Ti
A 96.2 96.4 95.9 96.2 95.4 96.1 95.3 671.5
B 96.8 96.1 97.3 96.3 97.4 97.7 97.3 678.9
C 97.4 98.5 98.8 98.7 97.4 97.8 98.2 686.8
D 94.2 95.2 96.4 94.7 96.5 95.5 96.6 669.1
E 95.1 95.5 96  97.6 95.7 96.3 95.9 672.1
総計                     3378.41

どなたかお願いします・・・


959 :132人目の素数さん:2007/01/22(月) 20:37:06
とあるサイトAでアンケートを取って100の回答を得ました。
その後、他のサイトBで同じアンケートを実施して300の回答を得ました。

Aの結果とBの結果を比較する事によって、
特定のサイトのバイアス(ユーザーの属性によるバイアス)を軽減できる、
と言えるのでしょうか?

特にAの結果とBの結果の傾向が同じ場合は、
インターネットユーザーの平均的回答に近くなる、と言えるのでしょうか?

960 :132人目の素数さん:2007/01/22(月) 22:59:04
捕手。

961 :132人目の素数さん:2007/01/23(火) 00:14:28
さいころを6000回振って、1100回1がでた。そのサイコロの1の出る確率をPとする。
(1)Pの不偏推定値と信頼係数0.95における区間推定値を求めよ

教えてください


962 :132人目の素数さん:2007/01/23(火) 04:36:18
ネットで統計的にまともなアンケート取るなんて不可能に近くないか?

963 :132人目の素数さん:2007/01/23(火) 15:09:37
>>962
>>959はネットに限定して調査を行っているんだからそれはそれで妥当じゃない?
ネット上の調査の母集団代表性についても様々に議論がされてて、
実のところ、従来の電話調査や訪問調査が個人情保護や固定電話の減少などで
その代表性が薄れて来ていて、実はより一般的なインフラであるネットが
如実に現実を示している、という説もある。

964 :132人目の素数さん:2007/01/23(火) 23:18:19
>>963
インターネットのリーチャビリティだけならたしかにインフラかつ普遍的だが、
残念ながらそれだけじゃアンケートはとれないからな。

そこにwebを持ってくると途端に話が怪しくなる。

SPAM業者が持ってるメールアドレスリストを使ってアンケートをとれれば
webサイトでアンケートなんてのよりかなりマシになると思うけど、
さすがにそういうわけにはいかんしね。

965 :132人目の素数さん:2007/01/24(水) 15:28:25
αの推定値からt値を計算するのに実際のαの値がなくても出来るの?

966 :132人目の素数さん:2007/01/24(水) 20:13:46
ある地域で世論調査を行い、区十引きで抜いた100人にA政党の支持を問うた
ところ、45人が支持すると回答した。
開票の結果、A政党の支持率は50%であった。以上のような結果はよく生じる
と考えてよいか?

解き方教えてください。

967 :132人目の素数さん:2007/01/24(水) 20:31:58

ある物の長さを測るのに1センチ単位の物差(1ミリ単位の目盛は付いていない)
で1センチまで測定する方法を考案せよ。
(ヒント)測定値は確率変数で大数の法則を使う。
本当に困ってます.........
できるかたいますか?教えてください。




968 :132人目の素数さん:2007/01/24(水) 21:08:50
ホッホッホ。季節の風物詩じゃのう。
みんな苦労するものじゃ。

969 :132人目の素数さん:2007/01/24(水) 21:16:32
1センチを測るときは1mmの物差しが必要だと技術家庭でおそわるぞ。


970 :132人目の素数さん:2007/01/24(水) 23:40:43
定規が2本あれば(片方が三角定規だとなおいい)1cm刻みしかない定規を使って
1mm刻みの定規が自作できますがな。

971 :132人目の素数さん:2007/01/25(木) 03:25:41
中央値を0.5でとる理由を教えて


972 :132人目の素数さん:2007/01/25(木) 04:30:23
見ていて思ったんですが、>>900の(1)はN(b,a^2)ではないのでしょうか?

973 :132人目の素数さん:2007/01/25(木) 23:48:49
相関の検定について、2点教えてください。
無相関の検定を、相関係数rを求めてr表からおこなう場合と、t0を計算してt表から行う場合とでは、どのような違いで方法を分けるのでしょうか。
また、ρ≠0の検定の時に、母相関係数ρ0とは、何を見て「いくつ」とするのでしょうか。
素人な質問で、すみません。どうか、わかりやすくお願いします。

974 :132人目の素数さん:2007/01/25(木) 23:59:51
すみません
>973の2番目の質問、意味不明な感じですね。書き直します。
ある製品からサンプリングしたn100のデータを計算し、相関検定で相関がないとはいえないことが判明したので、ρはいくつなのかを検定する事にした。
この場合、ρ≠0の検定でキム仮説にあてはめる母相関係数ρ0とは、「いくつ」とするのでしょうか。
質問として成り立っているか、少々不安ですが、どうかお願いします。

975 :132人目の素数さん:2007/01/26(金) 00:39:41
推定量の満たすべき性質には不偏性、一致性、漸近正規性、有効性がありますが
有効性と一致性が同じように思えるのですが違いはなんでしょうか。

(このスレ解答者が少なすぎ、神降臨しないかな…)

976 :132人目の素数さん:2007/01/26(金) 01:25:36
>>973
r表って教科書に載ってるの見たことないけど正確な分布に基づくものなの?
それならt0の計算は近似だと思うのでr表の方がいいよね。

>>974
検定ってデータを得る前に仮説を立てるんだよね。前提が間違ってるよ。w

977 :132人目の素数さん:2007/01/26(金) 01:26:59
>>975
明らかに宿題、レポートと思われるものは暇人しか答えんわな。w
それに君のように教科書の定義を見るだけのものもね。

978 :975:2007/01/26(金) 14:36:08
>977
流石に教科書を見ないで質問することなんてしません…
見ても分からないから質問したのですが。

有効性…推定量の分散が小さい
一致性…n→大のとき、推定量が、真の母数θに近づく。

母数θに収束するなら分散が小さくなって当たり前だと思うんです。

979 :132人目の素数さん:2007/01/26(金) 17:58:11
>>967
適当に計ったときに、ものの両端内にある定規のメモリの数は、
ものの長さによって確率的に異なる。

たとえば、1mmの長さのものより、9mmの長さのもののほうが、両端の間にメモリが存在しやすい。
これは明らかだろ?

後は、数式書いて考えれ。

980 :132人目の素数さん:2007/01/26(金) 18:07:52
>>966
この時代、ひとつの政党が支持率50%なんてほぼ有り得ない。
だから「よくは生じない」かな。
統計というより、常識だろ。

>>978
君のその「当たり前」を直観に頼ってではなく数学的に説明してごらんなさい。


981 :132人目の素数さん:2007/01/26(金) 20:07:19
すいません。初心者の質問です。
モノはこちら(http://amazon.co.jp/o/ASIN/4274065707/)からです。

    電話 メール 直接 計
女性  400 1600 2000 4000
男性  600 2400 3000 6000
計  1000 4000 5000 10000
(p153 表7.2 「性別」と「されたい告白方法」のクロス集計表)

なるものがあり、そこから300人の標本を抽出して
カイ二乗統計量を求めるという作業を20000回行うと、
以下の実験結果が得られた。

     ピアソンのカイ二乗統計量
1回目 0.8598
2回目 0.7557


20000回目 2.7953
(p154 表7.3 実験結果)

982 :132人目の素数さん:2007/01/26(金) 20:09:15
>>978
単に分散が小さいと書いてある教科書はないと思うがな。
勝手に自分で解釈しないようにな。

983 :続き:2007/01/26(金) 20:09:18
この表7.3に基づくヒストグラムが以下の図である。

0.5

0.4
  ■
0.3■
  ■
0.2■■
  ■■■
0.1■■■■
  ■■■■■■――____
0 0.5      5.5      10.5      15.5

(p154 図7.1 表7.3に基づくヒストグラム(階級の幅が1))

結論:自由度2のカイ二乗分布にしたがうのは間違いないようである。

ということが書かれているのですが、
何度前後読み合わせても、
この表7.3がこの図7.1になるということが理解できません。
この表の縦軸と横軸は一体何を意味しているのでしょうか?

どなたか、よろしくお願いします。

984 :132人目の素数さん:2007/01/26(金) 20:09:53
すいません、sage忘れました。

985 :132人目の素数さん:2007/01/26(金) 20:20:38
>>983
横軸 χ2乗統計量
縦軸 確率密度

でよろしいか?


986 :132人目の素数さん:2007/01/26(金) 20:20:45
ちょっとキミ達の力を貸してくれ。
2つのクラスターの特徴を多面的に捉えるのに、統計学を使おうとおもったんだが
いかんせんアホなんで難渋してるんだ。

あなたは、あるサッカーチーム(別に野球でもかまわんが)の監督である。
自チームの選手たちは、「体力」や「シュート力」など数10項目から成る能力値を持っている。
監督のあなたは、彼らの能力値を手がかりに自分のチーム(そして敵のチーム)の
総合的な長所や短所を探りたいはずだ。

あなたは、どんな手法を使ってそれを探りますか?

987 :132人目の素数さん:2007/01/26(金) 20:29:47
>>985
ありがとうございます。

クレクレですいませんがもう少し教えてください。

1.何の確率密度のことでしょうか?
たとえば、全員のうちの直接告白されたい人の確率、
などになるのでしょうか?

2.たとえばその確率を、300人に対する試行の中で
カイ二乗統計量とは別に求めておくということでしょうか?

988 :132人目の素数さん:2007/01/26(金) 20:57:33
>>986
1.χ2乗統計量の確率密度
2.標本数2万ならχ2乗統計量は2万個ゲトできるでしょ?その確率密度関数ってこと。

989 :132人目の素数さん:2007/01/26(金) 22:58:43
統計には素人ですが、質問させてください。よろしくお願いします。

10種類の化合物群について、構造の特徴を示す数値と生理活性の
相関を調べたところ、9種について良い直線性があり、
ピアソンの検定で有意な相関を得ました。

ところが一種のみこの直線から逸脱しており、このサンプルを加えて
総計10種について解析すると、相関の有意性は失われます。

この一種類の化合物を他の化合物と区別するために用いるべき
統計的手法を教えてください。

要するに、この点を棄却でいるか否かを知りたいのですが・・・

990 :132人目の素数さん:2007/01/26(金) 23:41:05
>>988
結局全然分かりませんでしたが、
とりあえず重ねてありがとうございました。

991 :132人目の素数さん:2007/01/26(金) 23:48:09
統計学わからないので、代わりに論破してやってくださいm(__)m
http://school6.2ch.net/test/read.cgi/part/1160908138/

992 :132人目の素数さん:2007/01/27(土) 03:27:05
>>978
すいません。学部2年アンド文系の自分には無理そうです。教科書にもクラーメルラオの下限とかありますが、導出過程とかさっぱりなんで…
というかクラーメルラオの下限分からないと有効性って理解出来そうにないっすね。
はぁ、どうしよ…
>>982
そうですね。"不偏推定量の中で"分散が最小なものが有効推定量です(よね?)
すいませんこれ見落としてました。つまり有効推定量はいつでも不偏と。

数学のレベルが足りてないこともあって、有効性と一致性の違いはまだよく分からないです
一致なら有効なんじゃない?とも思ってしまいます。
ただ有効推定量はいつでも不偏なのに対し、一致推定量は不偏性は前提にしてない
ということは分かりました。

993 :992:2007/01/27(土) 03:34:00
あと。お詫びに次スレ建てておきました
http://science5.2ch.net/test/read.cgi/math/1169836298/

994 :132人目の素数さん:2007/01/27(土) 08:22:47
>>992
定義をよく読んで見えてきたじゃない。w
あとは自分で書いているように「分散が最小」というのが
一致性にはない条件だよね。

995 :132人目の素数さん:2007/01/27(土) 09:18:41
二百八十三日十二時間。


996 :132人目の素数さん:2007/01/27(土) 12:17:03
すみません、ちょっと質問させてください。ある医学論文で、統計処理の結果
の記載で、p>.36とかp=.0012などとあるのですが、小数点前の0は省略してある
と考えていいのでしょうか。どなたか回答をお願いします。

997 :132人目の素数さん:2007/01/27(土) 12:21:31
>>996
いい。むしろそれが常識。
>>990
いったい何がわかんないんだ?ヒストグラムの書き方は解るよな?
>>995
283.5
>>992
>すいません。学部2年アンド文系の自分には無理そうです。
つか、誰でも無理なんだって。偽なんだから。
自分で導出しようとしたら気付くだろ。

998 :132人目の素数さん:2007/01/27(土) 12:23:12
>>997
996です。早速ありがとうございました。

999 :132人目の素数さん:2007/01/27(土) 12:35:41
二百八十三日十五時間十七分。


1000 :132人目の素数さん:2007/01/27(土) 12:36:41
二百八十三日十五時間十八分。


1001 :1001:Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

320 KB
★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)