1.1.1 患者数据分析

请根据题目要求,在下方空白处填入正确的代码(点击 💡 按钮查看提示)

数据集说明
文件名:patient_data.csv
PatientIDAgeBMIBloodPressureCholesterolDaysInHospital
16238.31502112
26534.11182438
38222.81141778
48537.21542378
58532.412014920
62726.61202382
73921.61072135
85429.417420310
98819.91161346
103033.51782675
共 1000 条数据,仅展示前 10 条
导入库并读取数据
import pandas as pd import numpy as np # 读取数据集 1分 data =
1. 统计住院天数超过7天的患者数量及其占比
# 创建新列'RiskLevel',根据住院天数判断风险等级 3分 = (, '高风险患者', '低风险患者') # 统计不同风险等级的患者数量 2分 risk_counts = data. # 计算高风险患者占比 1分 high_risk_ratio = risk_counts['高风险患者'] / # 计算低风险患者占比 1分 low_risk_ratio = risk_counts['低风险患者'] / # 输出结果 print("高风险患者数量:", risk_counts['高风险患者']) print("低风险患者数量:", risk_counts['低风险患者']) print("高风险患者占比:", high_risk_ratio) print("低风险患者占比:", low_risk_ratio)
2. 统计不同BMI区间中高风险患者的比例和统计不同BMI区间中的患者数
# 定义BMI区间和标签 bmi_bins = [0, 18.5, 24, 28, np.inf] bmi_labels = ['偏瘦', '正常', '超重', '肥胖'] # 根据BMI值划分指定区间 4分 data['BMIRange'] = (, , , right=False) # 使用左闭右开区间 # 计算每个BMI区间中高风险患者的比例 2分 bmi_risk_rate = ()['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) # 统计每个BMI区间的患者数量 1分 bmi_patient_count = data # 输出结果 print("BMI区间中高风险患者的比例和患者数:") print(bmi_risk_rate) print(bmi_patient_count)
3. 统计不同年龄区间中高风险患者的比例和统计不同年龄区间中的患者数
# 定义年龄区间和标签 age_bins = [0, 26, 36, 46, 56, 66, np.inf] age_labels = ['≤25岁', '26-35岁', '36-45岁', '46-55岁', '56-65岁', '>65岁'] # 根据年龄值划分指定区间 4分 data['AgeRange'] = (, , , right=False) # 使用左闭右开区间 # 计算每个年龄区间中高风险患者的比例 2分 age_risk_rate = ()['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) # 统计每个年龄区间的患者数量 1分 age_patient_count = data # 输出结果 print("年龄区间中高风险患者的比例和患者数:") print(age_risk_rate) print(age_patient_count)
提示: