Python Dataframe (ข้อมูลเชิงตาราง)

การใช้งาน Python DataFrame ส่วนมากจะทำผ่านไลบรารี Pandas ซึ่งเป็นไลบรารีที่ทรงพลังในการจัดการและวิเคราะห์ข้อมูล โดย DataFrame เป็นโครงสร้างข้อมูลที่สำคัญในการทำงานกับข้อมูลเชิงตาราง (เช่น Excel หรือ SQL tables)

ขั้นตอนพื้นฐานในการใช้งาน Pandas DataFrame

1. ติดตั้ง Pandas (หากยังไม่ได้ติดตั้ง)

pip install pandas

2. นำเข้าไลบรารี Pandas

import pandas as pd

3. สร้าง DataFrame คุณสามารถสร้าง DataFrame ได้หลายวิธี เช่น จาก dictionary, list, หรืออ่านข้อมูลจากไฟล์ CSV, Excel ฯลฯ

จาก Dictionary:

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)
print(df)

จาก CSV file:

df = pd.read_csv('filename.csv')
print(df)

4. การเข้าถึงข้อมูลใน DataFrame

การเข้าถึงคอลัมน์:

print(df['Name'])  # เข้าถึงข้อมูลในคอลัมน์ Name

การเข้าถึงแถว:

print(df.iloc[0])  # เข้าถึงแถวแรก

5. การดำเนินการกับข้อมูล

การกรองข้อมูล:

filtered_df = df[df['Age'] > 30] print(filtered_df)

การคำนวณพื้นฐาน:

avg_age = df['Age'].mean() print("Average Age:", avg_age)

6. บันทึก DataFrame ลงในไฟล์

บันทึกเป็น CSV:

df.to_csv('output.csv', index=False)

บันทึกเป็น Excel:

df.to_excel('output.xlsx', index=False)

ฟังก์ชันที่น่าสนใจอื่น ๆ

df.describe(): ให้สถิติพื้นฐานของข้อมูล
df.head(n): แสดงแถวบนสุดของ DataFrame (ค่าเริ่มต้นคือ 5 แถว)
df.tail(n): แสดงแถวล่างสุดของ DataFrame

หากคุณมีคำถามเฉพาะเจาะจงเกี่ยวกับการใช้งาน DataFrame หรือปัญหาที่พบเจอ สามารถสอบถามเพิ่มเติมได้!