一、前言
在深度学习中,经常需要进行不同数据结构之间的转换。本文总结了常用的数据结构转换方法,包括:Dataframe、Series(pandas)、array(NumPy)、list、tensor(PyTorch)。
二、定义
2.1 Dataframe 和 Series
Dataframe 是一个二维表格数据结构,类似于电子表格或 SQL 表。Series 是 Dataframe 的一列或一行数据。
2.2 array
array 是 NumPy 中的数组结构,用于高效的数值计算。
2.3 tensor
tensor 是 PyTorch 深度学习框架中的数据结构,用于构建和训练神经网络模型。
三、互相转换
以下是一些常见的数据结构之间的转换示例:
四、详细总结
4.1 Dataframe 到 Series
<code>Series = Dataframe['column']</code>
4.2 Series 到 list
<code>list = Series.to_list()</code>
4.3 list 到 array
<code>array = np.array(list)</code>
4.4 array 到 torch.Tensor
<code>tensor = torch.from_numpy(array)</code>
4.5 torch.Tensor 到 array
<code>array = tensor.numpy() # 如果在 GPU 上,需要执行以下操作 array = tensor.cpu().numpy()</code>
4.6 torch.Tensor 到 list
<code>list = tensor.numpy().tolist()</code>
4.7 array 到 list
<code>list = array.tolist()</code>
4.8 list 到 torch.Tensor
<code>tensor = torch.Tensor(list)</code>
4.9 array 或 list 到 Series
<code>series = pd.Series({'a': array}) series2 = pd.Series({'a': list})</code>
之后可以根据需求进一步操作,例如将多个 Series 拼接成一个 Dataframe。
<code>df = pd.DataFrame({'aa': series, 'bb': series2})</code>
通过以上方法,可以方便地在不同数据结构之间进行转换,满足各种数据处理和深度学习任务的需求。
© 版权声明
THE END
暂无评论内容