如何使用 ChatGPT 通过高级数据分析制作图表和表格

如何使用 ChatGPT 制作图表和表格

 

1.了解ChatGPT的不同版本

之前,我们讨论了 ChatGPT 的哪些版本提供了哪些图表工具。但不仅仅是图表工具。如果你想高效地使用 ChatGPT,你需要了解各个版本可以做什么。

ChatGPT 免费版: 此版本历来使用的是 GPT-3.5 大型语言模型 (LLM),其功能不如 GPT-4 版本。截至 2024 年 5 月,GPT-4o LLM 也可供一些免费用户使用,并将随着时间的推移逐步推出。

ChatGPT Plus: ChatGPT Plus 是 OpenAI 的商业化、功能齐全的 ChatGPT 版本。目前,ChatGPT Plus 为每个会话提供三个主要选择选项:GPT-3.5、GPT-4 和 GPT-4o。它过去提供插件,但这些插件已被自定义 GPT取代。

GPT-4 和 GPT-4o 版本现在包括 DALL-E 3、Bing Web 访问和高级数据分析。一些用户报告称,使用 Bing 进行 Web 访问有些困难。我们将主要使用高级数据分析组件。即使没有 Bing Web 访问,GPT-4 和 4o 报告称,训练数据现在也包括截至 2023 年 12 月的信息。 

在本文的大部分内容中,我们将使用 GPT-4 选项的高级数据分析组件。此工具将导入多种文件格式的数据表。虽然它没有指定导入数据的大小限制,但它可以处理相当大的文件,但如果文件超过某个未定义的复杂程度,它就会中断。

随着 ChatGPT Plus 不断变化,我们将向您提供更多信息。现在,我们先来看一下如何制作一些很酷的图表。

ChatGPT Enterprise:企业版 还提供高级数据分析和插件 。您可以将文件上传到企业版,并且这些文件将保密。企业版还应允许更大的文件和更大的响应。价格尚未确定。

 

2. 创建基本表

让我们从一个例子开始。在接下来的演示中,我们将使用人口最多的五个城市。

列出世界人口最多的五座城市。包括国家。

我向 ChatGPT 的免费版本提出了这个问题,以下是我得到的答复:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图

将这些数据转换成表格很简单。只需告诉 ChatGPT 你想要一个表格即可:

制作一张按人口排名世界前五的城市的表格。包括国家。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图1

3. 操作表格

您可以通过向 ChatGPT 提供更详细的说明来操作和自定义表格。同样,使用免费版本,我们将添加人口计数字段。当然,这些数据已经过时了,但无论如何都会呈现:

制作一张按人口排名世界前五的城市的表格。包括国家和人口字段

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图2

您还可以为表格指定某些细节,例如字段顺序和单位。在这里,我首先移动国家/地区,然后压缩人口数量。

制作一张按人口排名世界前五的城市的表格。包括国家和人口字段。按排名、国家、城市、人口的顺序显示字段。以百万为单位显示人口(保留一位小数),因此 37,833,000 将显示为 37.8M。

请注意,我向 AI 提供了一个我希望如何显示数字的示例。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图3

这就是免费版本所能达到的极限。从现在开始,我们将改用每月 20 美元的 ChatGPT Plus 版本

4. 创建条形图

启用高级数据分析功能的 ChatGPT Plus 可以制作折线图、条形图、直方图、饼图、散点图、热图、箱线图、面积图、气泡图、甘特图、帕累托图、网络图、桑基图、分级统计图、雷达图、词云、树形图和 3D 图表。

在这个例子中,我们只制作一个简单的条形图。

制作按人口排名世界前五的城市的条形图

这是一个很健谈的小工具,不是吗?

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图4

眼尖的读者可能已经注意到上表和此处结果之间的人口差异。请注意,表格有一个绿色图标,而此图表有一个紫色图标。我们从 GPT-3.5(ChatGPT 的免费版本)跳转到 GPT-4(ChatGPT Plus 中)。有趣的是,不同的 LLM 的数据略有不同。这种差异是使用 AI 时要小心谨慎的原因之一,因此请仔细检查您的工作。在我们的例子中,我们只是演示图表,但这是一个有形的例子,说明自信呈现的数据可能是错误的或不一致的。  

5.上传数据

Advanced Data Analytics 的超能力之一是能够上传数据集。为了举例说明,我 从 Data.gov下载了流行婴儿名字数据集。这是 2011 年至 2014 年纽约市婴儿名字的逗号分隔文件。尽管它已经过时十年了,但玩起来还是很有趣的。

我为本文选择的数据集可从政府网站轻松获得,因此您可以自行复制此实验。Data.gov 上有大量优秀的数据集,但我发现许多数据集对于 ChatGPT 来说太大了。 

下载这个后,我意识到它还包含了种族信息,所以我们可以从同一个数据集运行许多不同的图表。

单击小上传按钮,然后告诉它您要导入的数据文件。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图5

我要求它显示文件的前五行,以便我了解更多有关文件格式的信息。

6. 创建饼图(并更改颜色)

我很好奇数据集中性别名称的分布情况。这是我的第一个提示:

创建一个饼图,显示性别占总体数据集的百分比

结果如下:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图6

 

不幸的是,深绿色使数字难以阅读。幸运的是,你可以指示 Advanced Data Analytics 使用不同的颜色。我小心地选择了不会强化性别刻板印象的颜色。

创建一个饼图,以显示性别占总体数据集的百分比。浅绿色表示男性,中黄色表示女性。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图7

7. 规范化数据以确保准确性

正如我们之前所见,收集的数据包括种族。以下是如何查看 2010 年代初纽约记录的各种种族的分布情况:

使用饼图显示数据集中的种族分布。仅使用浅色。

这就是结果。注意到什么了吗?

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图8

显然,纽约没有正确地规范化其数据。它使用了“非西班牙裔白人”和“非西班牙裔白人”,“非西班牙裔黑人”和“非西班牙裔黑人”,以及“亚裔和太平洋岛民”和“亚裔和太平洋岛民”一起使用。这导致数据表示不准确。

ChatGPT 的一个优点是它能记住整个会话中的指令。所以我可以给它下达这个指令:

对于以下所有请求,将“非西班牙裔白人”和“非西班牙裔白人”分组在一起。将“非西班牙裔黑人”和“非西班牙裔黑人”分组在一起。将“亚裔和太平洋岛民”和“亚裔和太平洋岛民”分组在一起。显示种族时,请使用两个种族名称中较长的一个。

它回答说:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图9

让我们使用相同的提示再次尝试该图表。

使用饼图显示数据集中的种族分布。仅使用浅色。

这样更好:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图8

查看结果时需要细心。例如,在对热门婴儿名字的请求中,AI 将“Madison”和“MADISON”分离为两个不同的名字:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图10

对于以下所有要求,婴儿名字均不区分大小写。

 

8. 导出图形

让我们用一个提示来总结一下复杂的图表。这是我们的提示:

对于每个种族,提供两个饼图,每个性别一个。每个饼图应列出该性别和该种族的前五个婴儿名字。仅使用浅色。

事实证明,图表生成的文本太小,无法阅读。因此,为了获得更有用的图表,我们可以将其导出。我将指定文件格式和文件宽度:

将此图表导出为 3000 像素宽的 JPG 文件。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图11

结果如下:

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图12

请注意,Sofia 和 Sophia 非常受欢迎,但显示为两个不同的名字。但这正是图表如此吸引人的地方。

 

常问问题

使用高级数据分析需要多少费用?

ChatGPT Plus 附带高级数据分析功能。其部分功能在 GPT-4o 中提供,适用于 ChatGPT 的免费版本。ChatGPT Plus 每月收费 20 美元。企业版中还包含高级数据分析功能,但尚未公布定价。

如何使用 ChatGPT 通过高级数据分析制作图表和表格插图6 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图7 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图8 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图9 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图13 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图10 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图11 如何使用 ChatGPT 通过高级数据分析制作图表和表格插图12

上传到 ChatGPT 进行图表绘制的数据是否保密,或者是否存在数据泄露的风险?

假设始终存在隐私风险。

我向 ChatGPT 询问了这个问题,它是这样告诉我的: 

数据隐私是 ChatGPT 的首要任务。上传的数据仅用于用户当前会话,不会长期存储或用于任何其他目的。但是,对于高度敏感的数据,用户应始终保持谨慎,并考虑使用 ChatGPT 的企业版,该版本提供增强的数据保密性。

我的建议:不要相信 ChatGPT 或任何生成式 AI 工具。企业版应该具有更多的隐私控制,但我建议您只上传那些您不介意公开的数据。

 

ChatGPT 的高级数据分析可以处理实时数据还是更适合静态数据集?

这是可能的,但也有一些实际限制。首先,Plus 帐户会限制您在给定时间段内可以发出的请求数量。其次,您必须单独上传每个文件。您可以使用获得许可的 ChatGPT API 进行实时分析。但对于聊天机器人本身,您正在查看静态数据解析。

标签