黑狐家游戏

泰坦尼克号数据集分析python代码,泰坦尼克号数据集分析

欧气 3 0

泰坦尼克号数据集的深度剖析与洞察

泰坦尼克号数据集是一个经典的数据集,它记录了泰坦尼克号号船上乘客的相关信息,包括他们的年龄、性别、舱位等级、票价、是否幸存等,通过对这个数据集的分析,我们可以了解到当时乘客的生存情况与各种因素之间的关系。

以下是使用 Python 语言对泰坦尼克号数据集进行分析的代码:

import pandas as pd
import matplotlib.pyplot as plt
读取数据集
titanic = pd.read_csv('titanic.csv')
查看数据集的前几行
print(titanic.head())
数据清洗
处理缺失值
titanic = titanic.dropna()
数据探索
查看不同性别乘客的幸存情况
survived_by_gender = titanic.groupby('Sex')['Survived'].value_counts(normalize=True)
print(survived_by_gender)
查看不同舱位等级乘客的幸存情况
survived_by_pclass = titanic.groupby('Pclass')['Survived'].value_counts(normalize=True)
print(survived_by_pclass)
数据可视化
绘制不同性别乘客的幸存比例柱状图
plt.bar(survived_by_gender.index, survived_by_gender.values)
plt.xlabel('Gender')
plt.ylabel('Survival Rate')
plt.title('Survival Rate by Gender')
plt.show()
绘制不同舱位等级乘客的幸存比例柱状图
plt.bar(survived_by_pclass.index, survived_by_pclass.values)
plt.xlabel('Pclass')
plt.ylabel('Survival Rate')
plt.title('Survival Rate by Pclass')
plt.show()

通过对泰坦尼克号数据集的分析,我们可以得到以下结论:

1、性别对幸存率有显著影响,女性乘客的幸存率明显高于男性乘客,这可能是由于当时的社会观念和性别角色的影响,女性在船上得到了更多的照顾和保护。

2、舱位等级对幸存率也有一定的影响,高舱位等级的乘客幸存率相对较高,而低舱位等级的乘客幸存率较低,这可能与舱位等级所提供的服务和设施有关,高舱位等级的乘客可能有更好的逃生机会和条件。

3、年龄对幸存率也有一定的影响,儿童和年轻人的幸存率相对较高,而老年人的幸存率较低,这可能与年轻人的身体素质和逃生能力有关,他们更容易在紧急情况下逃脱。

通过对泰坦尼克号数据集的分析,我们可以了解到当时乘客的生存情况与各种因素之间的关系,这些结论可以为我们提供一些关于灾难应对和安全管理的启示。

标签: #泰坦尼克号 #数据集 #分析 #Python

黑狐家游戏
  • 评论列表

留言评论