來盤點一下數(shù)據(jù)分析常用的術(shù)語解釋。建議大家收藏起來方便查看。
按照以下三類進行匯總。
1、互聯(lián)網(wǎng)常用名詞解釋
2、統(tǒng)計學(xué)名詞解釋
3、數(shù)據(jù)分析名詞解釋
一、互聯(lián)網(wǎng)常用名詞解釋
1、PV(Page View)頁面瀏覽量
指某段時間內(nèi)訪問網(wǎng)站或某一頁面的用戶的總數(shù)量,通常用來衡量一篇文章或一次活動帶來的流量效果,也是評價網(wǎng)站日常流量數(shù)據(jù)的重要指標。PV可重復(fù)累計,以用戶訪問網(wǎng)站作為統(tǒng)計依據(jù),用戶每刷新一次即重新計算一次。
2、UV(Unique Visitor)獨立訪客
指來到網(wǎng)站或頁面的用戶總數(shù),這個用戶是獨立的,同一用戶不同時段訪問網(wǎng)站只算作一個獨立訪客,不會重復(fù)累計,通常以PC端的Cookie數(shù)量作為統(tǒng)計依據(jù)。
3、Visit 訪問
指用戶通過外部鏈接來到網(wǎng)站,從用戶來到網(wǎng)站到用戶在瀏覽器中關(guān)閉頁面,這一過程算作一次訪問。
Visit可重復(fù)累計,比如我打開一個網(wǎng)站又關(guān)閉,再重新打開,這就算作兩次訪問。
4、Home Page 主頁
指一個網(wǎng)站起主目錄功能的頁面,也是網(wǎng)站起點。通常是網(wǎng)站首頁。
5、Landing Page 著陸頁
指用戶從外部鏈接來到網(wǎng)站,直接跳轉(zhuǎn)到的第一個頁面。比如朋友給我發(fā)了一個介紹爆款T恤的淘寶鏈接,我點開會直接跳轉(zhuǎn)到介紹T恤的那個頁面,而不是淘寶網(wǎng)眾多其他頁面之一,這個介紹T恤的頁面可以算作是著陸頁。
6、Bounce Rate 跳出率
指用戶通過鏈接來到網(wǎng)站,在當(dāng)前頁面沒有任何交互就離開網(wǎng)站的行為,這就算作此頁面增加了一個“跳出”,跳出率一般針對網(wǎng)站的某個頁面而言。
跳出率=在這個頁面跳出的用戶數(shù)/PV
7、退出率
一般針對某個頁面而言。指用戶訪問某網(wǎng)站的某個頁面之后,從瀏覽器中將與此網(wǎng)站相關(guān)的所有頁面全部關(guān)閉,就算此頁面增加了一個“退出“。
退出率=在這個頁面退出的用戶數(shù)/PV
8、Click 點擊
一般針對付費廣告而言,指用戶點擊某個鏈接、頁面、banner的次數(shù),可重復(fù)累計。比如我在PC端看到一則新聞鏈接點進去看了一會就關(guān)了,過了一會又點進去看了一遍,這就算我為這篇新聞貢獻兩次點擊。
9、avr.time 平均停留時長
指某個頁面被用戶訪問,在頁面停留時長的平均值,通常用來衡量一個頁面內(nèi)容的質(zhì)量。
avr.time=訪客數(shù)量/用戶總停留時長
10、CTR 點擊率
指某個廣告、Banner、URL被點擊的次數(shù)和被瀏覽的總次數(shù)的比值。一般用來考核廣告投放的引流效果。
CTR=點擊數(shù)(click)/被用戶看到的次數(shù)
11、Conversion rate 轉(zhuǎn)化率
指用戶完成設(shè)定的轉(zhuǎn)化環(huán)節(jié)的次數(shù)和總會話人數(shù)的百分比,通常用來評價一個轉(zhuǎn)化環(huán)節(jié)的好壞,如果轉(zhuǎn)化率較低則急需優(yōu)化該轉(zhuǎn)化環(huán)節(jié)。
轉(zhuǎn)化率=轉(zhuǎn)化會話數(shù)/總會話數(shù)
12、漏斗
通常指產(chǎn)生目標轉(zhuǎn)化前的明確流程,比如在淘寶購物,從點擊商品鏈接到查看詳情頁,再到查看顧客評價、領(lǐng)取商家優(yōu)惠券,再到填寫地址、付款,每個環(huán)節(jié)都有可能流失用戶,這就要求商家必須做好每一個轉(zhuǎn)化環(huán)節(jié),漏斗是評價轉(zhuǎn)化環(huán)節(jié)優(yōu)劣的指標。
13、投資回報率(ROI:Return On Investment )
反映投入和產(chǎn)出的關(guān)系,衡量我這個投資值不值得,能給到我多少價值的東西(非單單的利潤),這個是站在投資的角度或長遠生意上看的。
其計算公式為:投資回報率(ROI)=年利潤或年均利潤/投資總額×100%,通常用于評估企業(yè)對于某項活動的價值,ROI高表示該項目價值高。
14、重復(fù)購買率
指消費者在網(wǎng)站中的重復(fù)購買次數(shù)。
15、Referrer 引薦流量
通常指將用戶引導(dǎo)至目標頁面的URL(超鏈接)。在百度統(tǒng)計中,引薦流量叫做“外部鏈接”。
16、流失分析(Churn Analysis/Attrition Analysis)
描述哪些顧客可能停止使用公司的產(chǎn)品/業(yè)務(wù),以及識別哪些顧客的流失會帶來最大損失。流失分析的結(jié)果用于為可能要流失的顧客準備新的優(yōu)惠。
17、顧客細分&畫像(Customer Segmentation & Profiling)
根據(jù)現(xiàn)有的顧客數(shù)據(jù),將特征、行為相似的顧客歸類分組。描述和比較各組。
18、顧客的生命周期價值 (Lifetime Value, LTV)
顧客在他/她的一生中為一個公司產(chǎn)生的預(yù)期折算利潤。
19、購物籃分析(Market Basket Analysis)
識別在交易中經(jīng)常同時出現(xiàn)的商品組合或服務(wù)組合,例如經(jīng)常被一起購買的產(chǎn)品。此類分析的結(jié)果被用于推薦附加商品,為陳列商品的決策提供依據(jù)等。
20、實時決策(Real Time Decisioning, RTD)
幫助企業(yè)做出實時(近乎無延遲)的最優(yōu)銷售/營銷決策。比如,實時決策系統(tǒng)(打分系統(tǒng))可以通過多種商業(yè)規(guī)則或模型,在顧客與公司互動的瞬間,對顧客進行評分和排名。
21、留存/顧客留存(Retention / Customer Retention)
指建立后能夠長期維持的客戶關(guān)系的百分比。
22、社交網(wǎng)絡(luò)分析(Social Network Analysis, SNA)
描繪并測量人與人、組與組、機構(gòu)與機構(gòu)、電腦與電腦、URL與URL、以及其他種類相連的信息/知識實體之間的關(guān)系與流動。這些人或組是網(wǎng)絡(luò)中的節(jié)點,而它們之間的連線表示關(guān)系或流動。SNA為分析人際關(guān)系提供了一種方法,既是數(shù)學(xué)的又是視覺的。
23、生存分析(Survival Analysis)
估測一名顧客繼續(xù)使用某業(yè)務(wù)的時間,或在后續(xù)時段流失的可能性。此類信息能讓企業(yè)判斷所要預(yù)測時段的顧客留存,并引入合適的忠誠度政策。
二、統(tǒng)計學(xué)名詞解釋
1、絕對數(shù)和相對數(shù)
絕對數(shù):是反應(yīng)客觀現(xiàn)象總體在一定時間、一定地點下的總規(guī)模、總水平的綜合性指標,也是數(shù)據(jù)分析中常用的指標。比如年GDP,總?cè)丝诘鹊取?/p>
相對數(shù):是指兩個有聯(lián)系的指標計算而得出的數(shù)值,它是反應(yīng)客觀現(xiàn)象之間的數(shù)量聯(lián)系緊密程度的綜合指標。相對數(shù)一般以倍數(shù)、百分數(shù)等表示。相對數(shù)的計算公式:
相對數(shù)=比較值(比數(shù))/基礎(chǔ)值(基數(shù))
2、百分比和百分點
百分比:是相對數(shù)中的一種,他表示一個數(shù)是另一個數(shù)的百分之幾,也成為百分率或百分數(shù)。百分比的分母是100,也就是用1%作為度量單位,因此便于比較。
百分點:是指不同時期以百分數(shù)的形式表示的相對指標的變動幅度,1%等于1個百分點。
3、頻數(shù)和頻率
頻數(shù):一個數(shù)據(jù)在整體中出現(xiàn)的次數(shù)。
頻率:某一事件發(fā)生的次數(shù)與總的事件數(shù)之比。頻率通常用比例或百分數(shù)表示。
4、比例與比率
比例:是指在總體中各數(shù)據(jù)占總體的比重,通常反映總體的構(gòu)成和比例,即部分與整體之間的關(guān)系。
比率:是樣本(或總體)中各不同類別數(shù)據(jù)之間的比值,由于比率不是部分與整體之間的對比關(guān)系,因而比值可能大于1。
5、倍數(shù)和番數(shù)
倍數(shù):用一個數(shù)據(jù)除以另一個數(shù)據(jù)獲得,倍數(shù)一般用來表示上升、增長幅度,一般不表示減少幅度。
番數(shù):指原來數(shù)量的2的n次方。
6、同比和環(huán)比
同比:指的是與歷史同時期的數(shù)據(jù)相比較而獲得的比值,反應(yīng)事物發(fā)展的相對性。
環(huán)比:指與上一個統(tǒng)計時期的值進行對比獲得的值,主要反映事物的逐期發(fā)展的情況。
7、變量
變量來源于數(shù)學(xué),是計算機語言中能儲存計算結(jié)果或能表示值抽象概念。變量可以通過變量名訪問。
8、連續(xù)變量
在統(tǒng)計學(xué)中,變量按變量值是否連續(xù)可分為連續(xù)變量與離散變量兩種。在一定區(qū)間內(nèi)可以任意取值的變量叫連續(xù)變量,其數(shù)值是連續(xù)不斷的,相鄰兩個數(shù)值可作無限分割,即可取無限個數(shù)值。如:年齡、體重等變量。
9、離散變量
離散變量的各變量值之間都是以整數(shù)斷開的,如人數(shù)、工廠數(shù)、機器臺數(shù)等,都只能按整數(shù)計算。離散變量的數(shù)值只能用計數(shù)的方法取得。
10、定性變量
又名分類變量:觀測的個體只能歸屬于幾種互不相容類別中的一種時,一般是用非數(shù)字來表達其類別,這樣的觀測數(shù)據(jù)稱為定性變量??梢岳斫獬煽梢苑诸悇e的變量,如學(xué)歷、性別、婚否等。
11、均值
即平均值,平均數(shù)是表示一組數(shù)據(jù)集中趨勢的量數(shù),是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個數(shù)。
12、中位數(shù)
對于有限的數(shù)集,可以通過把所有觀察值高低排序后找出正中間的一個作為中位數(shù)。如果觀察值有偶數(shù)個,通常取最中間的兩個數(shù)值的平均數(shù)作為中位數(shù)。
13、缺失值
它指的是現(xiàn)有數(shù)據(jù)集中某個或某些屬性的值是不完全的。
14、缺失率
某屬性的缺失率=數(shù)據(jù)集中某屬性的缺失值個數(shù)/數(shù)據(jù)集總行數(shù)。
15、異常值
指一組測定值中與平均值的偏差超過兩倍標準差的測定值,與平均值的偏差超過三倍標準差的測定值,稱為高度異常的異常值。
16、方差
是在概率論和統(tǒng)計方差衡量隨機變量或一組數(shù)據(jù)時離散程度的度量。概率論中方差用來度量隨機變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。統(tǒng)計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù)。在許多實際問題中,研究方差即偏離程度有著重要意義。方差是衡量源數(shù)據(jù)和期望值相差的度量值。
17、標準差
中文環(huán)境中又常稱均方差,是離均差平方的算術(shù)平均數(shù)的平方根,用σ表示。標準差是方差的算術(shù)平方根。標準差能反映一個數(shù)據(jù)集的離散程度。平均數(shù)相同的兩組數(shù)據(jù),標準差未必相同。
18、皮爾森相關(guān)系數(shù)
皮爾森相關(guān)系數(shù)是用來反映兩個變量線性相關(guān)程度的統(tǒng)計量。相關(guān)系數(shù)用r表示,其中n為樣本量,分別為兩個變量的觀測值和均值。r描述的是兩個變量間線性相關(guān)強弱的程度。r的絕對值越大表明相關(guān)性越強。
19、相關(guān)系數(shù)
相關(guān)系數(shù)是最早由統(tǒng)計學(xué)家卡爾·皮爾遜設(shè)計的統(tǒng)計指標,是研究變量之間線性相關(guān)程度的量,一般用字母r表示。由于研究對象的不同,相關(guān)系數(shù)有多種定義方式,較為常用的是皮爾森相關(guān)系數(shù)。
20、特征值
特征值是線性代數(shù)中的一個重要概念。在數(shù)學(xué)、物理學(xué)、化學(xué)、計算機等領(lǐng)域有著廣泛的應(yīng)用。設(shè)A是向量空間的一個線性變換,如果空間中某一非零向量通過A變換后所得到的向量和X僅差一個常數(shù)因子,即AX=kX,則稱k為A的特征值,X稱為A的屬于特征值k的特征向量或特征矢量。