一、astype函數 Python
astype
函數是NumPy中的一個重要函數,常用于數組的數據類型轉換。它的基本語法是:astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
,其中dtype
參數表示指定的目標數據類型,可以是Python數據類型或NumPy中定義的數據類型,其余參數都是可選的。
例如,假設我們有一個二維數組x
:
import numpy as np x = np.array([[1, 2], [3, 4], [5, 6]]) print(x.dtype) # 輸出:int64
默認情況下,x
的數據類型為int64
。如果我們想將它轉換為float
類型,可以這樣做:
y = x.astype(float) print(y.dtype) # 輸出:float64 print(y) # 輸出:[[1. 2.] # [3. 4.] # [5. 6.]]
在這個例子中,astype
函數將x
數組的數據類型從int64
轉換為float64
。
二、astype不是定義函數
注意,astype
不是Python內置函數,它是NumPy庫中定義的一個函數。如果在使用astype
函數時遇到“astype is not defined”錯誤,可能是因為沒有正確導入NumPy庫或者代碼中的語法錯誤。
例如,以下示例中的代碼會導致“名字 'astype' 未定義”錯誤:
# 錯誤示例 x = [1, 2, 3, 4, 5] y = x.astype(float)
正確的代碼應該是:
# 正確示例 import numpy as np x = np.array([1, 2, 3, 4, 5]) y = x.astype(float)
三、參數說明
1. dtype參數
dtype
參數是必須指定的,表示目標數據類型。可以是Python數據類型,例如int
、float
、str
等,也可以是NumPy中的數據類型,例如np.int32
、np.float64
等。
如果指定的目標數據類型和數組的原始數據類型不一致,astype
函數將會執(zhí)行數據類型轉換。例如,將整型數組轉換為浮點型數組:
import numpy as np x = np.array([1, 2, 3]) y = x.astype(float) print(y) # 輸出:[1. 2. 3.]
需要注意的是,如果指定的數據類型無法表示原始數據,astype
函數會執(zhí)行截斷操作,也就是將數據截斷至目標數據類型的范圍內。例如,將大于255的無符號整型數據轉換為uint8
類型:
import numpy as np x = np.array([255, 256, 257], dtype=np.uint16) y = x.astype(np.uint8) print(y) # 輸出:[255 0 1]
2. order參數
order
參數用于指定數組的內存布局,默認值為'K'
,表示優(yōu)先使用數組本身的內存布局。當order
取值為'C'
或'F'
時,將強制使用按行排列('C'
)或按列排列('F'
)的內存布局。
例如,以下示例中的代碼將數組x
從按行排列('C'
)的內存布局轉換為按列排列('F'
)的內存布局:
import numpy as np x = np.array([[1, 2], [3, 4], [5, 6]]) y = x.astype(float, order='F') print(y.flags) # 輸出:C_CONTIGUOUS : False # F_CONTIGUOUS : True # OWNDATA : True # ...
3. casting參數
casting
參數用于指定數據類型轉換時的轉換規(guī)則,有三種取值:
'no'
:不允許任何轉換。
'equiv'
:只允許等價類型轉換,例如int
轉換為float
。
'unsafe'
:允許任何類型轉換,即使可能導致數據丟失。
例如,以下示例中的代碼不允許將浮點型數據轉換為整型:
import numpy as np x = np.array([1.2, 2.5, 3.7]) y = x.astype(int, casting='no') # 報錯:Can't cast float64 to int64 without losing precision
4. subok參數
subok
參數用于指定是否返回一個派生類,默認為True
,即返回一個與輸入參數類型相同的派生類。如果取值為False
,則返回一個NumPy數組對象。
以下示例中的代碼將返回一個類型為ndarray_subclass
的派生類:
import numpy as np class ndarray_subclass(np.ndarray): pass x = np.array([1, 2, 3], dtype=np.int32).view(ndarray_subclass) y = x.astype(float, subok=True) print(type(y)) # 輸出:
5. copy參數
copy
參數用于指定是否為返回的數組對象分配新的內存,默認為True
,即始終創(chuàng)建一個新數組并復制數據。如果取值為False
,則可能直接返回原始數組的視圖。
例如,以下示例中的代碼直接返回原始數組的視圖:
import numpy as np x = np.array([1, 2, 3], dtype=np.int32) y = x.astype(float, copy=False) print(y is x) # 輸出:True print(y.base is x) # 輸出:True