Python Dataframe (ข้อมูลเชิงตาราง)

การใช้งาน Python DataFrame ส่วนมากจะทำผ่านไลบรารี Pandas ซึ่งเป็นไลบรารีที่ทรงพลังในการจัดการและวิเคราะห์ข้อมูล โดย DataFrame เป็นโครงสร้างข้อมูลที่สำคัญในการทำงานกับข้อมูลเชิงตาราง (เช่น Excel หรือ SQL tables)

ขั้นตอนพื้นฐานในการใช้งาน Pandas DataFrame

1. ติดตั้ง Pandas (หากยังไม่ได้ติดตั้ง)

pip install pandas

2. นำเข้าไลบรารี Pandas

import pandas as pd

3. สร้าง DataFrame คุณสามารถสร้าง DataFrame ได้หลายวิธี เช่น จาก dictionary, list, หรืออ่านข้อมูลจากไฟล์ CSV, Excel ฯลฯ

  • จาก Dictionary:
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}


df = pd.DataFrame(data)
print(df)
  • จาก CSV file:
df = pd.read_csv('filename.csv')
print(df)

4. การเข้าถึงข้อมูลใน DataFrame

  • การเข้าถึงคอลัมน์:
print(df['Name'])  # เข้าถึงข้อมูลในคอลัมน์ Name
  • การเข้าถึงแถว:
print(df.iloc[0])  # เข้าถึงแถวแรก

5. การดำเนินการกับข้อมูล

  • การกรองข้อมูล:
filtered_df = df[df['Age'] > 30] print(filtered_df)
  • การคำนวณพื้นฐาน:
avg_age = df['Age'].mean() print("Average Age:", avg_age)

6. บันทึก DataFrame ลงในไฟล์

  • บันทึกเป็น CSV:
df.to_csv('output.csv', index=False)
  • บันทึกเป็น Excel:
df.to_excel('output.xlsx', index=False)

ฟังก์ชันที่น่าสนใจอื่น ๆ

  • df.describe(): ให้สถิติพื้นฐานของข้อมูล
  • df.head(n): แสดงแถวบนสุดของ DataFrame (ค่าเริ่มต้นคือ 5 แถว)
  • df.tail(n): แสดงแถวล่างสุดของ DataFrame

หากคุณมีคำถามเฉพาะเจาะจงเกี่ยวกับการใช้งาน DataFrame หรือปัญหาที่พบเจอ สามารถสอบถามเพิ่มเติมได้!

Scroll to Top