锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司

首頁 > 技術支持 > 做實驗需要掌握哪些統計學知識?

做實驗需要掌握哪些統計學知識?

點擊次數:784     更新時間:2025-01-04

統計學是數據分析的基石。學了統計學,你會發現很多時候的分析并不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果,但是這往往是粗糙的,準確的。如果學了統計學,那么我們就能以更多更科學的角度看待數據。 


大部分的數據分析,都會用到統計方面的以下知識,可以重點學習:

  • 基本的統計量:均值、中位數、眾數、方差、標準差、百分位數

  • 概率分布:幾何分布、二項分布、泊松分布、正態分布等

  • 總體和樣本:了解基本概念,抽樣的概念

  • 置信區間與假設檢驗:如何進行驗證分析

  • 相關性與回歸分析:一般數據分析的基本模型

通過基本的統計量,你可以進行更多元化的可視化,以實現更加精細化的數據分析。這個時候也需要你去了解更多的Excel函數來實現基本的計算,或者python、R里面一些對應的可視化方法。

有了總體和樣本的概念,你就知道在面對大規模數據的時候,怎樣去進行抽樣分析。

你也可以應用假設檢驗的方法,對一些感性的假設做出更加精確地檢驗。

利用回歸分析的方法,你可以對未來的一些數據、缺失的數據做基本的預測。

了解統計學的原理之后,你不一定能夠通過工具實現,那么你需要去對應的找網上找相關的實現方法,也可以看書。先推薦一本非常簡單的:吳喜之-《統計學·從數據到結論》。 

另外,如何精力允許,請掌握一些主流算法的原理,比如線性回歸、邏輯回歸、決策樹、神經網絡、關聯分析、聚類、協同過濾、隨機森林。再深入一點,還可以掌握文本分析、深度學習、圖像識別等相關的算法。關于這些算法,不僅需要了解其原理,你最好可以流暢地闡述出來,還需要你知曉其在各行業的一些應用場景。如果現階段不是工作剛需,可不作為重點。

本文算是一個知識點匯總,不做細致展開,讓大家了解統計學有哪幾大塊,每一類分別用于什么樣的分析場景。后面幾篇會以實際案例的方式,細致講講描述性統計、概率分布等。


知識點匯總:

1.集中趨勢

2.變異性

3.歸一化

4.正態分布

5.抽樣分布

6.估計

7.假設檢驗

8.T檢驗


一、集中趨勢

圖片


1.眾數

出現頻率最高的數;

2.中位數

把樣本值排序,分布在最中間的值;

樣本總數為奇數時,中位數為第(n+1)/2個值;

樣本總數為偶數時,中位數是第n/2個,第(n/2)+1個值的平均數;

3.平均數

所有數的總和除以樣本數量;

現在大家接觸最多的概念應該是平均數,但有時候,平均數會因為某些極值的出現收到很大影響。舉個小例子,你們班有20人,大家收入差不多,19人都是5000左右,但是有1個同學創業成功了,年入1個億,這時候統計你們班同學收入的“平均數"就是500萬了,這也很好的解釋了,每年各地的平均收入數據出爐,小伙伴們直呼給祖國拖后腿了,那是因為大家收入被平均了,此時,“中位數"更能合理的反映真實的情況;



二、變異性

圖片


1.四分位數

上面說到了“中位數",把樣本分成了2部分,再找個這2部分各自的“中位數",也就把樣本分為了4個部分,其中1/4處的值記為Q1,2/4處的值記為Q2,3/4處的值記為Q3

2.四分位距 IQR=Q3-Q1

圖片

3.異常值

小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);

對于異常值,我們在數據處理的環節就要剔除;

4.方差

圖片

5.平方偏差

方差的算術平方根

6.貝塞爾矯正:修正樣本方差

實際在計算方差時,分母要用n-1,而不是樣本數量n。原因在于,比如在高斯分布中,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本數據集的方差。由于樣本主要是落在x=u中心值附近,那么樣本如果用如下公式算方差,那么預測方差一定小于大數據集的方差(因為高斯分布的邊沿抽取的數據也很少)。為了能彌補這方面的缺陷,那么我們把公式的n改為n-1,以此來提高方差的數值,這種方法叫貝塞爾矯正系數。



三、歸一化

圖片


1.標準分數

一個給定分數 距離 平均數 多少個標準差?

標準分數是一種可以看出某分數在分布中相對位置的方法。

標準分數能夠真實的反映一個分數距離平均數的相對標準距離。

圖片


四、正態分布

圖片



1.定義:隨機變量X服從一個數學期望為μ,方差為σ?2;的正態分布,記為N(μ,σ?2;)

隨機取一個樣本,有68.3%的概率位于距離均值μ有1個標準差σ內;

有95.4%的概率位于距離均值μ有2個標準差σ內;

有99.7%的概率位于距離均值μ有3個標準差σ內;

圖片


五、抽樣分布

圖片


1.中心極限定理

設從均值為μ,方差為σ?2;的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ?2;/n的正態分布

2.抽樣分布

設總體共有N個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有N·n種抽法,即可以組成N·n不同的樣本,在不重復抽樣時,共有N·n個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。數理統計學的相關定理已經證明:在重置抽樣時,樣本均值的方差為總體方差的1/n。

舉個例子:

48盆MM豆,計算出每盆有幾個藍色的MM豆,48個數據構成了總體樣本。然后隨機選擇五盆,計算五盆中含有藍色MM豆的平均數,然后反復進行了50次。這就是n為5的樣本均值抽樣。

圖片


六、估計

圖片


1. 誤差界限

圖片

2. 置信度

We are some % sure the true population parameter falls within a specific range

我們有百分之多少確信總體中的值落在一個特定范圍內;

一般情況下,取95%的置信度就可以;

3. 置信區間

圖片


七、假設檢驗

圖片

1.問題:什么是顯著性水平?

顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率,也就是Type I Error

A Type II Error is when you fail to reject the null when it is actually false.

圖片

圖片

2. 如何選擇備選檢驗和零假設?

一個研究者想證明自己的研究結論是正確的,備擇假設的方向就要與想要證明其正確性的方向一致;

同時將研究者想收集證據證明其不正確的假設作為原假設H0


八、T檢驗

圖片


1. 主要用于樣本含量較小(例如n<30),總體標準差σ未知的正態分布。

流程如下:

圖片

是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著;

一般檢驗水準α取0.05即可;

計算檢驗統計量的方法根據樣本形式不同;

2. 獨立樣本T檢驗:

現在要分析男生和女生的身高是否相同兩者的主要區別在于數據的來源和要分析的問題。

圖片

問題:為什么T檢驗查表時候要n-1?

樣本均值替代總體均值損失了一個自由度

3. 配對樣本t檢驗

分析人的早晨和晚上的身高是否不同,于是找來一撥人測他們早上和晚上的身高,這里每個人就有兩個值,這里出現了配對

圖片

樣本誤差(Standard Error)

圖片


圖片

4. Pooled variance 合并方差

當樣本平均數不一樣,但實際上認為他們的方差是一樣的時候,需要合并方差

不要被公式嚇到,他的本質是兩個樣本方差加權平均

圖片


圖片

5. Cohen’s d

效應量(effect size):提示組間真正的差異占統計學差異的比例,值越大,組間差異越可靠。

圖片

圖片


在線咨詢 聯系方式 二維碼

服務熱線

13973264378

掃一掃,關注我們

主站蜘蛛池模板: 智能家居全屋智能系统多少钱一套-小米全套价格、装修方案 | 升降机-高空作业车租赁-蜘蛛车-曲臂式伸缩臂剪叉式液压升降平台-脚手架-【普雷斯特公司厂家】 | 桑茶-七彩贝壳桑叶茶 长寿茶 | 螺杆式冷水机-低温冷水机厂家-冷冻机-风冷式-水冷式冷水机-上海祝松机械有限公司 | 膏剂灌装旋盖机-眼药水灌装生产线-西林瓶粉剂分装机-南通博琅机械科技 | 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 深圳美安可自动化设备有限公司,喷码机,定制喷码机,二维码喷码机,深圳喷码机,纸箱喷码机,东莞喷码机 UV喷码机,日期喷码机,鸡蛋喷码机,管芯喷码机,管内壁喷码机,喷码机厂家 | 耐火浇注料-喷涂料-浇注料生产厂家_郑州市元领耐火材料有限公司 耐力板-PC阳光板-PC板-PC耐力板 - 嘉兴赢创实业有限公司 | 高低温万能试验机_拉力试验机_拉伸试验机-馥勒仪器科技(上海)有限公司 | 水篦子|雨篦子|镀锌格栅雨水篦子|不锈钢排水篦子|地下车库水箅子—安平县云航丝网制品厂 | 网站建设-临朐爱采购-抖音运营-山东兆通网络科技 | PCB厂|线路板厂|深圳线路板厂|软硬结合板厂|电路板生产厂家|线路板|深圳电路板厂家|铝基板厂家|深联电路-专业生产PCB研发制造 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 滚塑PE壳体-PE塑料浮球-警示PE浮筒-宁波君益塑业有限公司 | 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 防弹玻璃厂家_防爆炸玻璃_电磁屏蔽玻璃-四川大硅特玻科技有限公司 | 包塑丝_高铁绑丝_地暖绑丝_涂塑丝_塑料皮铁丝_河北创筹金属丝网制品有限公司 | 净化车间装修_合肥厂房无尘室设计_合肥工厂洁净工程装修公司-安徽盛世和居装饰 | 成都竞价托管_抖音代运营_网站建设_成都SEM外包-成都智网创联网络科技有限公司 | 隧道窑炉,隧道窑炉厂家-山东艾瑶国际贸易 | 报警器_家用防盗报警器_烟雾报警器_燃气报警器_防盗报警系统厂家-深圳市刻锐智能科技有限公司 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 内窥镜-工业内窥镜厂家【上海修远仪器仪表有限公司】 | 篷房|仓储篷房|铝合金篷房|体育篷房|篷房厂家-华烨建筑科技官网 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 苏州西装定制-西服定制厂家-职业装定制厂家-尺品服饰西装定做公司 | 【MBA备考网】-2024年工商管理硕士MBA院校/报考条件/培训/考试科目/提前面试/考试/学费-MBA备考网 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 面粉仓_储酒罐_不锈钢储酒罐厂家-泰安鑫佳机械制造有限公司 | SEO网站优化,关键词排名优化,苏州网站推广-江苏森歌网络 | 单电机制砂机,BHS制砂机,制沙机设备,制砂机价格-正升制砂机厂家 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 振动筛-交叉筛-螺旋筛-滚轴筛-正弦筛-方形摇摆筛「新乡振动筛厂家」 | 全自动定氮仪-半自动凯氏定氮仪厂家-祎鸿仪器 | 外贸网站建设-外贸网站设计制作开发公司-外贸独立站建设【企术】 | 一航网络-软件测评官网| 【官网】博莱特空压机,永磁变频空压机,螺杆空压机-欧能优 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 安徽控制器-合肥船用空调控制器-合肥家电控制器-合肥迅驰电子厂 安徽净化板_合肥岩棉板厂家_玻镁板厂家_安徽科艺美洁净科技有限公司 | 商用绞肉机-熟肉切片机-冻肉切丁机-猪肉开条机 - 广州市正盈机械设备有限公司 | 硫化罐_蒸汽硫化罐_大型硫化罐-山东鑫泰鑫智能装备有限公司 |