1.1.1 患者数据分析

请根据题目要求，在下方空白处填入正确的代码（点击 💡 按钮查看提示）

数据集说明

文件名：patient_data.csv

PatientID	Age	BMI	BloodPressure	Cholesterol	DaysInHospital
1	62	38.3	150	211	2
2	65	34.1	118	243	8
3	82	22.8	114	177	8
4	85	37.2	154	237	8
5	85	32.4	120	149	20
6	27	26.6	120	238	2
7	39	21.6	107	213	5
8	54	29.4	174	203	10
9	88	19.9	116	134	6
10	30	33.5	178	267	5

共 1000 条数据，仅展示前 10 条

导入库并读取数据

import pandas as pd import numpy as np # 读取数据集 1分 data =

1. 统计住院天数超过7天的患者数量及其占比

# 创建新列'RiskLevel'，根据住院天数判断风险等级 3分 = (, '高风险患者', '低风险患者') # 统计不同风险等级的患者数量 2分 risk_counts = data. # 计算高风险患者占比 1分 high_risk_ratio = risk_counts['高风险患者'] / # 计算低风险患者占比 1分 low_risk_ratio = risk_counts['低风险患者'] / # 输出结果 print("高风险患者数量:", risk_counts['高风险患者']) print("低风险患者数量:", risk_counts['低风险患者']) print("高风险患者占比:", high_risk_ratio) print("低风险患者占比:", low_risk_ratio)

2. 统计不同BMI区间中高风险患者的比例和统计不同BMI区间中的患者数

# 定义BMI区间和标签 bmi_bins = [0, 18.5, 24, 28, np.inf] bmi_labels = ['偏瘦', '正常', '超重', '肥胖'] # 根据BMI值划分指定区间 4分 data['BMIRange'] = (, , , right=False) # 使用左闭右开区间 # 计算每个BMI区间中高风险患者的比例 2分 bmi_risk_rate = ()['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) # 统计每个BMI区间的患者数量 1分 bmi_patient_count = data # 输出结果 print("BMI区间中高风险患者的比例和患者数:") print(bmi_risk_rate) print(bmi_patient_count)

3. 统计不同年龄区间中高风险患者的比例和统计不同年龄区间中的患者数

# 定义年龄区间和标签 age_bins = [0, 26, 36, 46, 56, 66, np.inf] age_labels = ['≤25岁', '26-35岁', '36-45岁', '46-55岁', '56-65岁', '＞65岁'] # 根据年龄值划分指定区间 4分 data['AgeRange'] = (, , , right=False) # 使用左闭右开区间 # 计算每个年龄区间中高风险患者的比例 2分 age_risk_rate = ()['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) # 统计每个年龄区间的患者数量 1分 age_patient_count = data # 输出结果 print("年龄区间中高风险患者的比例和患者数:") print(age_risk_rate) print(age_patient_count)