政府網(wǎng)站普查監(jiān)測小技巧,“為什么很多政府網(wǎng)站群負責人說網(wǎng)站群普查考核加入更新量指標吃力不討好,總有對更新量數(shù)據(jù)準確性的投訴?”
雖然網(wǎng)站更新量監(jiān)測是政府網(wǎng)站監(jiān)測考核的核心指標,但宜采用“大時間跨度全站更新情況定性統(tǒng)計”或“全站更新量歷史回溯統(tǒng)計”方法,不宜做“每日精確統(tǒng)計”,因為網(wǎng)站更新量統(tǒng)計在較小的時間跨度內(nèi),無法實現(xiàn)精確統(tǒng)計。我們認為這其中的原因很復雜,有技術(shù)實現(xiàn)問題,也有人為因素,其中人為因素更多。舉例如下:
■ 有分站因為業(yè)務(wù)流程原因、或為了爭取普查監(jiān)測達標,或者為了取得更好監(jiān)測考核成績,可能會在月底最后一天將前三十天數(shù)據(jù)一并補錄到網(wǎng)站上,而發(fā)布日期則被人為分散在1-30日,這造成按日統(tǒng)計的更新量監(jiān)測軟件對該分站之前每天的監(jiān)測結(jié)果出現(xiàn)漏報。這種“補錄信息”情況在網(wǎng)站普查監(jiān)測中并非個案,有相當大比例的網(wǎng)站會因各種原因采用這種網(wǎng)站更新方式,也不能說這種方法是“考核作弊”。此種更新方式造成的“更新量準確性投訴”是最多的,從技術(shù)角度也很難避免。
■ 還有分站將同一信息在多個欄目多次發(fā)布,造成認定規(guī)則歧義。網(wǎng)站更新軟件一般將頁面地址相同的信息視為一條信息,但有些網(wǎng)站因各種原因對同一條信息在不同欄目中進行引用,造成軟件數(shù)量計算上的“漏報”,或者是“信息的欄目歸類錯誤”。此類投訴數(shù)量居于第二。
■ 分站頻繁的欄目格式變動或改版也是造成更新量監(jiān)測數(shù)據(jù)不準原因。目前的網(wǎng)頁掃描軟件,如果要得到精確欄目更新量數(shù)據(jù),一般都采用人工配置欄目映射的方法。但是如果目標網(wǎng)站欄目調(diào)整,而欄目配置沒有隨之調(diào)整就會造成網(wǎng)頁抓取漂移,欄目更新量統(tǒng)計錯誤的情況。對于大型網(wǎng)站群(有近百個分站),這種網(wǎng)站欄目或格式調(diào)整造成漂移的情況幾乎每周都會發(fā)生,無法確保每次分站改版都能第一時間告知監(jiān)測單位及時變更欄目配置。這也是造成網(wǎng)站更新量監(jiān)測不準的重要原因。
以上幾點可以充分證明“實時精確的更新量統(tǒng)計”在實際操作中難以實現(xiàn),或者要付出極大成本,“非不為也,實不能也”。
|