你有没有想过,电商平台为什么总能推荐你刚好想买的东西?或者,为什么新闻App会自动给你推感兴趣的资讯?这些背后,其实藏着一个叫‘聚类分析’的小能手。
什么是聚类分析?
简单说,聚类分析就是把一堆杂乱的数据按相似性自动分组。它不需要提前知道分类标准,而是让数据自己“抱团”,找出隐藏的规律。就像整理衣柜,把T恤、外套、裤子自动分开,不用你一条条标好。
超市里的顾客画像
某连锁超市发现,每天晚上8点后进店的人,大多只买牛奶、面包和牙膏。通过聚类分析,系统把这些顾客归为“晚归上班族”群体。于是,超市在晚间时段把这些商品摆到入口处,销量立马涨了两成。
学生作业也能用聚类?
有位中学老师用聚类分析学生月考成绩。输入数学、英语、物理三科分数后,算法自动分出三类学生:理科强但英语弱、全科均衡型、偏科明显型。老师据此调整辅导策略,不再“一刀切”讲课。
一段简单的Python示例
用sklearn做聚类其实不难。比如要把一群人的身高体重数据分成三组:
from sklearn.cluster import KMeans
import numpy as np
# 模拟10个人的身高(cm)和体重(kg)
data = np.array([[170, 65], [180, 75], [160, 50], [175, 70],
[165, 55], [185, 85], [155, 45], [178, 72],
[168, 60], [182, 80]])
kmeans = KMeans(n_clusters=3)
kmeans.fit(data)
print(kmeans.labels_)
运行后会输出每个样本对应的类别编号,比如[1 2 0 2 0 2 0 2 1 2],说明这10人被分成了三个体型群体。
手机照片自动分类
现在手机相册的“回忆”功能,能把你的旅行照、聚会照、宠物照自动归类。这其实就是聚类在起作用——根据时间、地点、画面颜色和物体识别结果,把相似的照片归到一起。
小成本创业也能用
有个卖手工皂的小店主,用聚类分析客户购买记录。发现有群人总是买薰衣草味+包装礼盒,另一群人偏好柠檬味+散装实惠装。她于是设计了两款套餐,复购率提升了近四成。
聚类分析听起来高大上,其实早就悄悄融入日常。只要你愿意从数据里找规律,它就能帮你省时间、提效率,哪怕是管账、带娃、做饭,都能找到用武之地。