當前位置:首頁 >  站長 >  網(wǎng)站運營 >  正文

網(wǎng)站數(shù)據(jù)分析:網(wǎng)站用戶的識別

 2017-11-16 13:34  來源:   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

談談用戶識別的幾種方法。

用戶分析是網(wǎng)站分析中一個重要的組成部分,在分析用戶之前我們必須首先能夠識別每個用戶,分辨哪些是”New Customer”,哪些是”Repeat Customer”。這樣不但能夠更加清晰地了解到底有多少用戶訪問了你的網(wǎng)站,分辨他們是誰(用戶ID、郵箱、性別年齡等);同時也能夠幫助你更好地跟蹤你的用戶,發(fā)現(xiàn)它們的行為特征、興趣愛好及個性化的設置等,以便于更好地把握用戶需求,提升用戶體驗。

通常當你的網(wǎng)站提供了注冊服務,而用戶注冊并登陸過你的網(wǎng)站,那么用戶可以更容易地被識別,因為網(wǎng)站一般都會保存注冊用戶的詳細信息;但是你的網(wǎng)站并不需要注冊,而用戶的行為以瀏覽為主,這是用戶識別就會顯得較為困難,下面提供了幾種常用的用戶識別的方法:

識別用戶的幾種方法

當用戶并未注冊登錄的情況下,識別用戶的唯一途徑就只剩下用戶瀏覽行為的點擊流數(shù)據(jù),通常情況下它們會保存在WEB日志里面,關于WEB日志的詳細說明可以參考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能導致用戶識別的不準確性,關于WEB日志的缺陷可以參考之前的文章——WEB日志的作用和缺陷,所以我們在選擇用戶識別方法的過程中,在條件允許的情況下盡量選擇更為準確的方法:

1、基于IP的用戶識別

IP地址是最容易獲取的信息,任何的WEB日志中均會包含,但其局限性也較為明顯:偽IP、代理、動態(tài)IP、局域網(wǎng)共享同一公網(wǎng)IP出口……這些情況都會影響基于IP來識別用戶的準確性,所以IP識別用戶的準確性比較低,目前一般不會直接采用IP來識別用戶。

2、基于IP+Agent的用戶識別

同樣基于最簡單形式的WEB日志,我們可以增加一項——Agent,來提高單一IP方式識別用戶的準確性。Agent也是WEB日志中一般都會包含的信息,通過IP+Agent的方式可以適當提高IP代理、公用IP這類情況下用戶的分辨度,同時通過Agent還可以識別網(wǎng)絡爬蟲等特殊“用戶”,但同樣準確度也欠高。

3、基于cookie的用戶識別

當你通過自定義Apache日志格式或者JavaScript的方法獲得用戶cookie的時候,其實你已經(jīng)找到了一個更有效的用戶識別的手段。cookie在未被清除的其前提下可以認為是跟某個訪問客戶端電腦綁定的(一個客戶端有可能包含多個cookie),所以用cookie來標識用戶其實指的是用戶使用的客戶端電腦,而并非用戶本身。

用cookie識別用戶的方法當然也存在缺陷:最常見的就是cookie被清除而導致用戶無法與原先記錄實現(xiàn)對應;同時由于客戶端電腦會被共用,或者用戶會在不同的電腦*問你的網(wǎng)站,這個時候cookie就無法直接對應到該用戶了。

4、基于用戶ID的用戶識別

基于用戶ID的用戶識別是最為準確,因為一般情況下用戶不同共享他的用戶ID,所以我們可以認為數(shù)據(jù)中的userid唯一地指向該用戶,幾乎不存在偏差。當然要使用用戶ID來識別用戶是需要一定的前提條件的:網(wǎng)站必須是提供用戶注冊登錄服務的,并且可以通過一些手段在點擊流數(shù)據(jù)中記錄userid。

所以對于一個需要用戶ID注冊登錄的網(wǎng)站來說,用戶唯一標識符的選擇可以遵從以下順序:當用戶注冊登錄時以userid為準,當用戶在未登錄狀態(tài)瀏覽時以用戶的cookie為準,當用戶未登錄且cookie無法獲取的情況下以IP+Agent為準;這樣就能從最大程度上識別唯一用戶。

這里推薦一個網(wǎng)站日志中cookie項的自定義設置方法,以便更好地識別用戶。cookie是從用戶端存放的cookie文件記錄中獲取的,這個文件里面一般在包含一個cookieid的同時也會記下用戶在該網(wǎng)站的userid(如果你的網(wǎng)站需要注冊登陸并且該用戶曾經(jīng)登錄過你的網(wǎng)站且cookie未被刪除),所以在記錄日志文件中cookie項的時候可以優(yōu)先去查詢cookie中是否含有用戶ID類的信息,如果存在則將用戶ID寫到日志的cookie項,如果不存在則查找是否有cookieid,如果有則記錄,沒有則記為”-”,這樣日志中的cookie就可以直接作為最有效的用戶唯一標識符被用作統(tǒng)計。當然這里需要注意該方法只有網(wǎng)站本身才能夠實現(xiàn),因為用戶ID作為用戶隱私信息只有該網(wǎng)站才知道其在cookie的設置及存放位置,第三方統(tǒng)計工具一般很難獲取。

獲取用戶信息的途徑

通過以上的方法實現(xiàn)用戶身份的唯一標識后,我們可以通過一些途徑來采集用戶的基礎信息、特征信息及行為信息,然后為每位用戶建立起詳細的Profile:

1)用戶注冊時填寫的用戶注冊信息及基本資料;

2)從網(wǎng)站日志中得到的用戶瀏覽行為數(shù)據(jù);

3)從數(shù)據(jù)庫中獲取的用戶網(wǎng)站業(yè)務應用數(shù)據(jù);

4)基于用戶歷史數(shù)據(jù)的推導和預測;

5)通過直接聯(lián)系用戶或者用戶調研的途徑獲得的用戶數(shù)據(jù);

6)有第三方服務機構提供的用戶數(shù)據(jù)。

識別并獲取用戶信息的價值

通過用戶身份識別及用戶基本信息的采集,我們可以通過網(wǎng)站分析的各種方法在網(wǎng)站是實現(xiàn)一些有價值的應用:

基于用戶特征信息的用戶細分;

基于用戶的個性化頁面設置;

基于用戶行為數(shù)據(jù)的關聯(lián)推薦;

基于用戶興趣的定向營銷;

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

熱門排行

信息推薦