DigvijayDD 发表于 2024-1-9 16:58:57

如何使用 OpenAI API 在 Python 中执行数据分析

手动分析数据集以提取有用的数据,甚至使用简单的程序来执行相同的操作,通常会变得复杂且耗时。幸运的是,借助 OpenAI API 和 Python,可以系统地分析数据集以获取有趣的信息,而无需过度设计代码并浪费时间。这可以用作数据分析的通用解决方案,无需使用不同的方法、库和 API 来分析数据集中不同类型的数据和数据点。 让我们从如何设置开始,逐步了解使用 OpenAI API 和 Python 分析数据的步骤。 目录 设置 要使用 OpenAI API 通过 Python 挖掘和分析数据,请安装openai和pandas库: pip3 install openai pandas 完成后,创建一个新文件夹并在新文件夹中创建一个空的 Python 文件。 分析文本文件 在本教程中,我认为让 Python 分析 Nvidia 最新的财报电话会议会很有趣。 下载我从The Motley Fool获得的最新 Nvidia 财报电话会议记录,并将其移至您的项目文件夹中。 然后打开空的 Python 文件并添加此代码。



该代码读取您下载的 Nvidia 收益记录并将其extract_info作为transcript变量传递给函数。 该extract_info函数将电话号码列表 示和记录作为用户输入传递,以及temperature=0.3和model="gpt-3.5-turbo-16k"。它使用“gpt-3.5-turbo-16k”模型的原因是它可以处理大型文本,例如此文字记录。在跟踪费用并优化成本,这会很有用。但由于我们只对响应文本感兴趣,因此我们通过指定completions.choices.message.content响应路径来获取它。 如果运行代码,您应该会得到与下面引用的类似的输出: 从文本中,我们可以提取出以下信息: 英伟达营收:2024财年第二季度,英伟达公布第二季度营收创历史新高,达到135.1亿美元,环比增长88%,同比增长101%。 英伟达本季度的表现:英伟达在各个领域都经历了非凡的增长。他们的数据中心业务收入创历史新高,环比增长 141%,同比增长 171%。他们的游戏业务也实现了增长,收入环比增长 11%,同比增长 22%。此外,他们的专业可视化部门的收入环比增长了 28%。他们还宣布与 Snowflake、ServiceNow、埃森哲、Hugging Face、VMware 和 SoftBank 等公司建立合作伙伴关系。

https://manchestermassage.net/wp-content/uploads/2024/01/marketing.png


关于人工智能的评论:英伟达强调了对其人工智能平台和加速计算解决方案的强劲需求。他们提到了主要云服务提供商和消费互联网公司部署他们的 HGX 系统。他们还讨论了生成式人工智能在营销、媒体和娱乐等各个行业的应用。英伟达强调了生成式人工智能在创造新市场机会和提高不同领域生产力方面的潜力。 正如您所看到的,代码提取了提示中指定的信息(Nvidia 的收入、Nvidia 本季度的业绩以及有关 AI 的评论)并将其打印出来。 分析 CSV 文件 分析财报电话会议记录和文本文件很酷,但要系统地分析大量数据,您需要使用 CSV 文件。 作为一个工作示例,下载此 Medium 文章 CSV 数据集并将其粘贴到您的项目文件中。 如果您查看 CSV 文件,您会发现它具有“作者”、“拍手”、“阅读时间”、“链接”、“标题”和“文本”列。要使用 OpenAI 分析媒体文章,您只需要“标题”和“文本”列。 在项目文件夹中创建一个新的 Python 文件并粘贴此代码。 这段代码与我们用来分析文本文件的代码有点不同。它逐一读取 CSV 行,提取指定的信息,并将它们添加到新列中。 在本教程中,我选择了 Medium 文章的 CSV 数据集,该数据集是从Kaggle 上的HSANKESARA获得的。此 CSV 分析代码将使用 CSV 文件的“标题”和“文章”列找到每篇文章的整体基调和主要内容/要点。

页: [1]
查看完整版本: 如何使用 OpenAI API 在 Python 中执行数据分析