pandas筆記

dataFrame常用函式

  • df.loc[row_indexer,column_indexer] : 選欄和列,可填入布林或index等等
    e.g. pdData.loc[pdData[0] == 1, 1:]

  • df.shape : 可看矩陣是幾乘幾

  • df.shape[0] : row數

  • df.shape[0] : column數

  • df.values : dataFrame的numpy表示式(會轉成巢狀)

  • df.iterrows() : iterates over DataFrame rows:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    """
    c1 c2
    0 10 100
    1 11 110
    2 12 120
    """
    for index, row in df.iterrows():
    print(row['c1'], row['c2'])
    >>>
    """
    10 100
    11 110
    12 120
    """
  • df.reset_index(drop=True) : 重新設定index(有時調整過rows之後,舊的index會留用,這個可以重新設定,預設會產生一個新的column叫index,為舊的index數值,drop=True可以不產生那一個column)