春满大地,富贵花开。微雨众卉新,一雷惊蛰始。敬请关注微信公众号:AiryData。

python计算下载客户端的pv和uv

Python Airy 1587℃ 0评论

需求:通过日志文件计算某个渠道某APP的下载PV和UV

#b1==’appdownload’ and b2==’clienth5′ and url == ‘http://m.moji.com/?from=ifengnews.*’,B1代表下载,b2代表渠道,URL代表下载地址。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# -*- coding: utf-8 -*-
#Filename:countpvuv.py
import glob,gzip
#创建字典用来存储PV和UV
dic={}
#下面是日志文件所在位置
for name in glob.glob('/data1/logs/actsta/2016-07-14/1000*.sta.gz'):
        for line in gzip.open(name):
        ss=line.split('\t')
        if len(ss)<12:#一条日志字段的长度
            continue
        b1,b2,url,uid=ss[0].strip(),ss[2].strip(),ss[3].strip(),ss[5].strip()
        if b1=='appdownload' and b2=='clienth5' and url == 'http://m.moji.com/?from=ifengnews.*':
            dic.setdefault(url,[0,set()])
            dic[url][0]+=1
            dic[url][1].add(uid)
for key in dic:
        print key,'\t',dic[key][0],'\t',len(dic[key][1])

这个脚本的功能是为了计算某个渠道通过某个下载页面下载客户端的PV和UV量,进行定量分析。分析各个渠道下载量的多少以及原因。如有问题,请留言,谢谢。

转载请注明:数据之美 » python计算下载客户端的pv和uv

喜欢 (7)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址