春满大地,富贵花开。微雨众卉新,一雷惊蛰始。敬请关注微信公众号:AiryData。

【实战】Python读写Excel实例应用

PYTHON Airy 4859℃ 0评论

预备阅读:Python使用xlrd和xlwt读写Excel的简单用法

前言

前面我们学习了简单的Python操作Excel的两个库xlrd和xlwt,今天来实际操作一个案例来增强实战功能。

案例背景

我们市场部的同学想通过分析广告投放时间前后(分钟级,前1分钟到后5分钟)的用户活跃数据来分析我们广告的投放效果,来决定是否继续投放和投放的其他选择性,所以他们需要我来帮忙计算一下数据。所以这里分享下实际操作。

数据准备

1、广告播放时间

这里的广告播放时间文件为ad.xlsx,由市场部同学提供,部分数据如下。

2、用户活跃数据

一般从数据库计算导出(SQL操作可以看我之前发布的MySQL相关知识),有时候也需要通过日志计算,已经计算好的数据uv.xlsx如下(分钟级)。这里我们区分了移动端和PC端。

数据计算

数据准备完毕之后,就可以直接计算了,因为前面已经说过xlrd和xlwt库的使用,这里直接贴上代码py_excel.py,大家可以实际操作试一试。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
#coding:utf-8
import xlrd
import xlwt
import re
import sys
import string
from datetime import datetime

#read the ad play time data
programFile = r'ad.xlsx'
#读取广告播放时间数据文件
adFile = r'ad.xlsx'

#打开文件并获取数据
adWb = xlrd.open_workbook(adFile)
adSheet = adWb.sheet_by_index(0)

#获取目标时间列(在第3列,由日期和时间拼接而成)
adTime = adSheet.col_values(2)

lenth_of_time = len(adTime)

#读取uv数据
uvFile = r'uv.xlsx'

uvWb = xlrd.open_workbook(uvFile)
#数据存储在一张表时,如果有多个sheet,要分开赋值
uvSheet = uvWb.sheet_by_index(0)

uvTime = uvSheet.col_values(0)
length = len(uvTime)

#初始化写操作
resultFile = xlwt.Workbook()
#在生成表的时候添加了两张sheet
resultMobile = resultFile.add_sheet('mobile', cell_overwrite_ok=True)
resultPC = resultFile.add_sheet('PC', cell_overwrite_ok=True)

i=1
while(i<lenth_of_time):
    print (i)
    playTime = xlrd.xldate_as_tuple(adTime[i],adWb.datemode)
    print (playTime)
    j = 1
    while(j<length):
        uvRow = uvSheet.row_values(j)
        uvTime = xlrd.xldate_as_tuple(uvRow[0],uvWb.datemode)
        #时间匹配
        if((playTime[0]==uvTime[0] and playTime[1]==uvTime[1] and playTime[2]==uvTime[2] and ((playTime[3]==uvTime[3] and uvTime[4]-playTime[4]>-2 and uvTime[4]-playTime[4]<6) or (uvTime[3]==playTime[3]+1 and uvTime[4]+60-playTime[4]>-2 and uvTime[4]+60-playTime[4]<6) or (uvTime[3]==playTime[3]-1 and uvTime[4]-59==0 and playTime[4]-0==0))) or (playTime[0]==uvTime[0] and playTime[1]==uvTime[1] and playTime[2]==uvTime[2]-1 and uvTime[3]==0 and playTime[3]==23 and uvTime[4]+60-playTime[4]<6)):
            gap = uvTime[4]-playTime[4]

            if(gap<-50):
                gap=gap+60
            if(gap==59):
                gap=-1

            if(uvRow[1]=='mo'):
                resultMobile.write(i,gap+1,uvRow[2])
            if(uvRow[1]=='pc'):
                resultPC.write(i,gap+1,uvRow[2])
        j = j + 1
    i = i + 1

#保存结果
resultFile.save(r'result.xls')

查看结果:

首行数据表示分钟。

小结

上面就是今天的主题内容了,今天分享下如何使用Python操作Excel进行读写文件生成目标数据,方便后面进行数据分析。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。

如果想快速联系我,欢迎关注微信公众号:AiryData。

如需转载,请联系授权,谢谢合作。

参考文件地址链接:http://pan.baidu.com/s/1geFdfMF 密码:xpq6

转载请注明:数据之美 » 【实战】Python读写Excel实例应用

喜欢 (15)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
(2)个小伙伴在吐槽
  1. 请问作者 python 代码的颜色字体用的是什么 scheme?
    tynbl2017-04-21 13:44 回复
    • 我这边用的是CodeColorer插件,你可以试一下,有很多。
      Airy2017-04-22 08:30 回复