1.1.4 用户行为数据分析

请根据题目要求,在下方空白处填入正确的代码(点击 💡 按钮查看提示)

数据集说明
文件名:user_behavior_data.csv
UserIDUserNameAgeGenderLocationLastLoginPurchaseAmountPurchaseCategoryReviewScoreLoginFrequency
1User_162FemaleLocation_12023-06-10118Clothing3Monthly
2User_265FemaleLocation_22023-08-14466Electronics4Weekly
3User_318MaleLocation_32023-02-17869Home & Garden3Weekly
4User_421FemaleLocation_42023-03-14486Books2Weekly
5User_521MaleLocation_52023-07-26753Home & Garden1Monthly
6User_657FemaleLocation_62023-02-20629Books2Monthly
7User_727FemaleLocation_72023-01-27113Home & Garden1Weekly
8User_837FemaleLocation_82023-03-11109Home & Garden1Daily
9User_939FemaleLocation_92023-01-06424Food2Weekly
10User_1068FemaleLocation_102023-10-04766Home & Garden2Monthly
共 1000 条数据,仅展示前 10 条
1. 数据采集
import pandas import numpy as np import matplotlib.pyplot as plt # 从本地文件中读取数据 2分 data = print("数据采集完成,已加载到DataFrame中") # 打印数据的前5条记录 2分 print()
2. 数据清洗与预处理
# 处理缺失值(删除) 2分 data = # 数据类型转换 data = (int) # Age数据类型转换为int 2分 data = (float) # PurchaseAmount数据类型转换为float 2分 data = (int) # ReviewScore数据类型转换为int 2分 # 处理异常值 2分 data = data[(.(18, 70)) & (data['PurchaseAmount'] > 0) & (.(1, 5))] # 数据标准化 data['PurchaseAmount'] = (data['PurchaseAmount'] - ) / # PurchaseAmount数据标准化 2分 data['ReviewScore'] = (data['ReviewScore'] - ) / # ReviewScore数据标准化 2分 # 保存清洗后的数据 1分 ('cleaned_user_behavior_data.csv', index=False) print("数据清洗完成,已保存为 'cleaned_user_behavior_data.csv'")
3. 数据统计
# 统计每个购买类别的用户数 2分 purchase_category_counts = . print("每个购买类别的用户数:\n", purchase_category_counts) # 统计不同性别的平均购买金额 2分 gender_purchase_amount_mean = ()['PurchaseAmount'].mean() print("不同性别的平均购买金额:\n", gender_purchase_amount_mean) # 统计不同年龄段的用户数 2分 bins = [18, 26, 36, 46, 56, 66, np.inf] labels = ['18-25', '26-35', '36-45', '46-55', '56-65', '65+'] data['AgeGroup'] = pandas.(, right=False) age_group_counts = data['AgeGroup'].value_counts().sort_index() print("不同年龄段的用户数:\n", age_group_counts)
提示: