数据集概览
Home & Kitchen 类目评论数据全貌,基于 Amazon Reviews'23 数据集
数据集概览
Home & Kitchen 是 Amazon Reviews'23 数据集中第二大的类目, 包含 67,409,944 条真实评论,横跨 15 年(1996–2023)。 本页面呈现驱动本站的数据全貌。
数据来源: Amazon Reviews'23 by McAuley Lab, UC San Diego
原始文件: Home_and_Kitchen.jsonl
评分分布
图:Home & Kitchen 全部评论的星级分布。
亚马逊评论存在明显的正面偏差。
| 评分 | 数量 | 占比 |
|---|---|---|
| 5 ★ | 44,701,824 | 66.3% |
| 4 ★ | 7,536,382 | 11.2% |
| 3 ★ | 4,600,479 | 6.8% |
| 2 ★ | 3,410,803 | 5.1% |
| 1 ★ | 7,160,456 | 10.6% |
平均评分: 4.18 / 5.00
这意味着什么
超过 83% 的评论是 4–5 星。这说明:
- 单看星级很难区分产品好坏 — 大多数产品都集中在 4.5 左右
- 1–2 星差评才是识别产品缺陷的关键信号
- 评论文本比星级更能帮助购买决策
评论真实性
| 指标 | 数量 | 占比 |
|---|---|---|
| 已验证购买 | 62,921,814 | 93.3% |
| 未验证来源 | 4,488,130 | 6.7% |
约 6.7% 的评论来自未验证来源(Vine 评测人、换评、非购买直接评价)。 已验证购买的评论可信度更高。
评论有用性
亚马逊用户可以为评论点"有帮助"。这个信号帮助我们找到最有价值的内容。
图:有帮助票数的对数分布。大多数评论获得 0 票。
| 有帮助票数 | 评论数量 | 占比 |
|---|---|---|
| 0 票 | 51,843,462 | 76.9% |
| ≥ 1 票 | 15,566,473 | 23.1% |
| ≥ 5 票 | 2,446,886 | 3.6% |
| ≥ 10 票 | 1,085,608 | 1.6% |
| ≥ 50 票 | 144,113 | 0.2% |
平均每评有帮助票数: 1.02 最高有帮助票数: 34619 票
“What can I say about the 571B Banana Slicer that hasn’t already been said about the wheel, penicillin, or the iPhone…. this is one of the greatest inventions of all time. My husband and I would argu…”
洞察
仅 23.1% 的评论获得了 1 票以上的"有帮助"。这意味着:
- 获 5+ 票的评论是稀有的真实洞察信号
- 约 144,113 条评论(0.3%)获得 50+ 票 — 这些是内容策展的金矿
评论长度分布
图:评论长度的百分位分布。红色虚线为平均值。
| 百分位 | 字符数 |
|---|---|
| 25th | 47 |
| 50th (中位) | 106 |
| 75th | 216 |
| 90th | 398 |
平均长度: 179 字符
一半的评论不足 106 个字符 — 约 1–2 句话。 仅 10% 超过 398 字符。长、详尽的评论稀缺且有价值。
用户实拍图
| 指标 | 数量 | 占比 |
|---|---|---|
| 含图片评论 | 5,636,288 | 8.4% |
| 纯文字评论 | 61,773,656 | 91.6% |
仅 8.4% 的评论包含用户实拍图 — 但这类评论恰恰是消费者最信任的。
评论时间趋势
图:每年评论量(柱状)和平均评分(折线)变化趋势。
| 年份 | 评论数 | 5★ 占比 | 验证购买占比 |
|---|---|---|---|
| 1998 | 2 | 100.0% | 0.0% |
| 1999 | 9 | 33.3% | 0.0% |
| 2000 | 1,001 | 64.0% | 13.3% |
| 2001 | 2,209 | 59.5% | 20.6% |
| 2002 | 3,695 | 55.8% | 24.1% |
| 2003 | 5,938 | 52.6% | 26.2% |
| 2004 | 7,353 | 49.8% | 25.5% |
| 2005 | 15,419 | 49.1% | 30.2% |
| 2006 | 24,972 | 52.8% | 36.7% |
| 2007 | 58,322 | 57.8% | 45.9% |
| 2008 | 68,207 | 56.4% | 48.1% |
| 2009 | 92,012 | 54.9% | 60.1% |
| 2010 | 159,296 | 55.2% | 78.9% |
| 2011 | 278,672 | 55.8% | 81.5% |
| 2012 | 500,445 | 58.4% | 85.6% |
| 2013 | 1,328,715 | 61.0% | 92.8% |
| 2014 | 2,222,935 | 63.6% | 89.0% |
| 2015 | 3,446,051 | 65.5% | 94.1% |
| 2016 | 4,493,405 | 66.7% | 92.3% |
| 2017 | 5,059,065 | 66.6% | 93.2% |
| 2018 | 5,833,876 | 67.3% | 95.3% |
| 2019 | 8,229,519 | 71.2% | 96.3% |
| 2020 | 10,540,330 | 68.6% | 96.2% |
| 2021 | 11,436,430 | 65.7% | 95.6% |
| 2022 | 9,601,338 | 63.1% | 90.3% |
| 2023 | 4,000,728 | 64.1% | 86.8% |
统计数据由原始数据集实时计算。基于全量评论扫描。