如何使用 ChatGPT 通过高级数据分析制作图表和表格

如何使用 ChatGPT 制作图表和表格

 

1.了解ChatGPT的不同版本

之前,我们讨论了 ChatGPT 的哪些版本提供了哪些图表工具。但不仅仅是图表工具。如果你想高效地使用 ChatGPT,你需要了解各个版本可以做什么。

ChatGPT 免费版: 此版本历来使用的是 GPT-3.5 大型语言模型 (LLM),其功能不如 GPT-4 版本。截至 2024 年 5 月,GPT-4o LLM 也可供一些免费用户使用,并将随着时间的推移逐步推出。

ChatGPT Plus: ChatGPT Plus 是 OpenAI 的商业化、功能齐全的 ChatGPT 版本。目前,ChatGPT Plus 为每个会话提供三个主要选择选项:GPT-3.5、GPT-4 和 GPT-4o。它过去提供插件,但这些插件已被自定义 GPT取代。

GPT-4 和 GPT-4o 版本现在包括 DALL-E 3、Bing Web 访问和高级数据分析。一些用户报告称,使用 Bing 进行 Web 访问有些困难。我们将主要使用高级数据分析组件。即使没有 Bing Web 访问,GPT-4 和 4o 报告称,训练数据现在也包括截至 2023 年 12 月的信息。 

在本文的大部分内容中,我们将使用 GPT-4 选项的高级数据分析组件。此工具将导入多种文件格式的数据表。虽然它没有指定导入数据的大小限制,但它可以处理相当大的文件,但如果文件超过某个未定义的复杂程度,它就会中断。

随着 ChatGPT Plus 不断变化,我们将向您提供更多信息。现在,我们先来看一下如何制作一些很酷的图表。

ChatGPT Enterprise:企业版 还提供高级数据分析和插件 。您可以将文件上传到企业版,并且这些文件将保密。企业版还应允许更大的文件和更大的响应。价格尚未确定。

 

2. 创建基本表

让我们从一个例子开始。在接下来的演示中,我们将使用人口最多的五个城市。

列出世界人口最多的五座城市。包括国家。

我向 ChatGPT 的免费版本提出了这个问题,以下是我得到的答复:

将这些数据转换成表格很简单。只需告诉 ChatGPT 你想要一个表格即可:

制作一张按人口排名世界前五的城市的表格。包括国家。

3. 操作表格

您可以通过向 ChatGPT 提供更详细的说明来操作和自定义表格。同样,使用免费版本,我们将添加人口计数字段。当然,这些数据已经过时了,但无论如何都会呈现:

制作一张按人口排名世界前五的城市的表格。包括国家和人口字段

您还可以为表格指定某些细节,例如字段顺序和单位。在这里,我首先移动国家/地区,然后压缩人口数量。

制作一张按人口排名世界前五的城市的表格。包括国家和人口字段。按排名、国家、城市、人口的顺序显示字段。以百万为单位显示人口(保留一位小数),因此 37,833,000 将显示为 37.8M。

请注意,我向 AI 提供了一个我希望如何显示数字的示例。

这就是免费版本所能达到的极限。从现在开始,我们将改用每月 20 美元的 ChatGPT Plus 版本

4. 创建条形图

启用高级数据分析功能的 ChatGPT Plus 可以制作折线图、条形图、直方图、饼图、散点图、热图、箱线图、面积图、气泡图、甘特图、帕累托图、网络图、桑基图、分级统计图、雷达图、词云、树形图和 3D 图表。

在这个例子中,我们只制作一个简单的条形图。

制作按人口排名世界前五的城市的条形图

这是一个很健谈的小工具,不是吗?

眼尖的读者可能已经注意到上表和此处结果之间的人口差异。请注意,表格有一个绿色图标,而此图表有一个紫色图标。我们从 GPT-3.5(ChatGPT 的免费版本)跳转到 GPT-4(ChatGPT Plus 中)。有趣的是,不同的 LLM 的数据略有不同。这种差异是使用 AI 时要小心谨慎的原因之一,因此请仔细检查您的工作。在我们的例子中,我们只是演示图表,但这是一个有形的例子,说明自信呈现的数据可能是错误的或不一致的。  

5.上传数据

Advanced Data Analytics 的超能力之一是能够上传数据集。为了举例说明,我 从 Data.gov下载了流行婴儿名字数据集。这是 2011 年至 2014 年纽约市婴儿名字的逗号分隔文件。尽管它已经过时十年了,但玩起来还是很有趣的。

我为本文选择的数据集可从政府网站轻松获得,因此您可以自行复制此实验。Data.gov 上有大量优秀的数据集,但我发现许多数据集对于 ChatGPT 来说太大了。 

下载这个后,我意识到它还包含了种族信息,所以我们可以从同一个数据集运行许多不同的图表。

单击小上传按钮,然后告诉它您要导入的数据文件。

我要求它显示文件的前五行,以便我了解更多有关文件格式的信息。

6. 创建饼图(并更改颜色)

我很好奇数据集中性别名称的分布情况。这是我的第一个提示:

创建一个饼图,显示性别占总体数据集的百分比

结果如下:

 

不幸的是,深绿色使数字难以阅读。幸运的是,你可以指示 Advanced Data Analytics 使用不同的颜色。我小心地选择了不会强化性别刻板印象的颜色。

创建一个饼图,以显示性别占总体数据集的百分比。浅绿色表示男性,中黄色表示女性。

7. 规范化数据以确保准确性

正如我们之前所见,收集的数据包括种族。以下是如何查看 2010 年代初纽约记录的各种种族的分布情况:

使用饼图显示数据集中的种族分布。仅使用浅色。

这就是结果。注意到什么了吗?

显然,纽约没有正确地规范化其数据。它使用了“非西班牙裔白人”和“非西班牙裔白人”,“非西班牙裔黑人”和“非西班牙裔黑人”,以及“亚裔和太平洋岛民”和“亚裔和太平洋岛民”一起使用。这导致数据表示不准确。

ChatGPT 的一个优点是它能记住整个会话中的指令。所以我可以给它下达这个指令:

对于以下所有请求,将“非西班牙裔白人”和“非西班牙裔白人”分组在一起。将“非西班牙裔黑人”和“非西班牙裔黑人”分组在一起。将“亚裔和太平洋岛民”和“亚裔和太平洋岛民”分组在一起。显示种族时,请使用两个种族名称中较长的一个。

它回答说:

让我们使用相同的提示再次尝试该图表。

使用饼图显示数据集中的种族分布。仅使用浅色。

这样更好:

查看结果时需要细心。例如,在对热门婴儿名字的请求中,AI 将“Madison”和“MADISON”分离为两个不同的名字:

对于以下所有要求,婴儿名字均不区分大小写。

 

8. 导出图形

让我们用一个提示来总结一下复杂的图表。这是我们的提示:

对于每个种族,提供两个饼图,每个性别一个。每个饼图应列出该性别和该种族的前五个婴儿名字。仅使用浅色。

事实证明,图表生成的文本太小,无法阅读。因此,为了获得更有用的图表,我们可以将其导出。我将指定文件格式和文件宽度:

将此图表导出为 3000 像素宽的 JPG 文件。

结果如下:

请注意,Sofia 和 Sophia 非常受欢迎,但显示为两个不同的名字。但这正是图表如此吸引人的地方。

 

常问问题

使用高级数据分析需要多少费用?

ChatGPT Plus 附带高级数据分析功能。其部分功能在 GPT-4o 中提供,适用于 ChatGPT 的免费版本。ChatGPT Plus 每月收费 20 美元。企业版中还包含高级数据分析功能,但尚未公布定价。

上传到 ChatGPT 进行图表绘制的数据是否保密,或者是否存在数据泄露的风险?

假设始终存在隐私风险。

我向 ChatGPT 询问了这个问题,它是这样告诉我的: 

数据隐私是 ChatGPT 的首要任务。上传的数据仅用于用户当前会话,不会长期存储或用于任何其他目的。但是,对于高度敏感的数据,用户应始终保持谨慎,并考虑使用 ChatGPT 的企业版,该版本提供增强的数据保密性。

我的建议:不要相信 ChatGPT 或任何生成式 AI 工具。企业版应该具有更多的隐私控制,但我建议您只上传那些您不介意公开的数据。

 

ChatGPT 的高级数据分析可以处理实时数据还是更适合静态数据集?

这是可能的,但也有一些实际限制。首先,Plus 帐户会限制您在给定时间段内可以发出的请求数量。其次,您必须单独上传每个文件。您可以使用获得许可的 ChatGPT API 进行实时分析。但对于聊天机器人本身,您正在查看静态数据解析。

标签