目录
前言1、常规赛数据格式2、计算詹姆斯常规赛命中率总结前言
为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。
这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。
(资料图片)
DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。True:返回DataFrame / MultiIndex;
False:返回包含字符串列表的Series / Index。
1、常规赛数据格式
勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:
日期 | 对手 | 比分 | 时间 | 投篮 | ... |
05/17 | 鹈鹕 | 110-98(胜) | 27 | 11-22 | ... |
05/16 | 步行者 | 122-115(胜) | 28 | 11-22 | ... |
... | ... | ... | ... | ... | ... |
2、计算詹姆斯常规赛命中率
勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。
import numpy as np import pandas as pd df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk") df0 = df["投篮"].str.split("-",expand=True) df0.columns = ["命中数","投篮数"]
DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:
0 | 命中数 | 投篮数 |
1 | 11 | 22 |
2 | 11 | 22 |
... | ... | ... |
因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。
df0["命中数"] = df0["命中数"].astype("int") df0["投篮数"] = df0["投篮数"].astype("int") ShootRate = df0["命中数"].sum() / df0["投篮数"].sum()
计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。
总结
到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 2转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 3充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 4好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 5名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 6亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战
- 7京东绿色建材线上平台上线 新增用户70%来自下沉市场
- 8网红淘品牌“七格格”chuu在北京又开一家店 潮人新宠chuu能红多久
- 9市场竞争加剧,有车企因经营不善出现破产、退网、退市
- 10北京市市场监管局为企业纾困减负保护经济韧性