当前位置: 首页 -  必威体育 - 正文

数据分析实战:利用python对心脏病数据集进行分析

2020-06-18 16:41 必威体育 青栀186°c
A+ A-
胸痛类型和心脏病、血压三者关系

表中有个数据是胸痛类型四个,分别是0123,他们和心脏病有关系吗,作图看看。

数据分析实战:利用python对心脏病数据集进行分析

今天在kaggle上看到一个心脏病数据(数据集下载地址和源码见文末),那么借此深入分析一下。

chol: 该朋友的胆固醇测量值,单位 :mg/dl

年龄-心率-患病三者关系

在这个数据集中,心率的词是‘thalach’,所以看年龄、心率、是否患病的关系。

plt.scatter(x=data.thalach[data.target==1], y=data.trestbps[data.target==1], c="#FFA773") plt.scatter(x=data.thalach[data.target==0], y=data.trestbps[data.target==0], c="#8DE0FF") plt.legend(["患病",'未患病']) plt.xlabel("心率") plt.ylabel("血压") plt.show()

数据分析实战:利用python对心脏病数据集进行分析

没患病人数:138 ,没有得心脏病比率: 45.54%
plt.scatter(x=data.age[data.target==1], y=data.chol[data.target==1], c="orange") plt.scatter(x=data.age[data.target==0], y=data.chol[data.target==0], c="green") plt.legend(["患病",'未患病']) plt.xlabel("年龄") plt.ylabel("胆固醇") plt.show() # 箱型图 sns.boxplot(x=data.target,y=data.chol,data=data)

数据分析实战:利用python对心脏病数据集进行分析

数据集中还有很多维度可以组合分析,下边开始进行组合式探索分析