ایجاد و ذخیره DataFrame

ایجاد و ذخیره DataFrame در پانداس

در کتابخانه Pandas، DataFrame یکی از ساختارهای داده‌ای اصلی است که برای کار با داده‌های جدولی استفاده می‌شود. این ساختار انعطاف‌پذیر امکان ذخیره و پردازش داده‌ها را به صورت سطر و ستون فراهم می‌کند.


روش‌های ایجاد DataFrame

برای ایجاد یک DataFrame در پانداس، روش‌های مختلفی وجود دارد:

  • از طریق دیکشنری‌های پایتون
  • از طریق لیست‌ها
  • از طریق فایل‌های خارجی (مانند CSV، Excel و ...)
  • از طریق پایگاه داده‌های SQL

توجه: DataFrameها در پانداس شبیه به جداول در پایگاه داده یا صفحات اکسل عمل می‌کنند.

روش ایجاد مثال
دیکشنری pd.DataFrame({'ستون1': [1,2], 'ستون2': ['a','b']})
لیست pd.DataFrame([[1,'a'], [2,'b']], columns=['ستون1', 'ستون2'])

ذخیره DataFrame

پانداس امکان ذخیره DataFrame در قالب‌های مختلف را فراهم می‌کند:

  1. ذخیره به صورت فایل CSV با استفاده از to_csv()
  2. ذخیره در قالب Excel با استفاده از to_excel()
  3. ذخیره در پایگاه داده SQL با استفاده از to_sql()
  4. ذخیره در قالب JSON با استفاده از to_json()

برای مثال، ذخیره یک DataFrame به صورت فایل CSV:

df.to_csv('data.csv', index=False, encoding='utf-8-sig')

برای یادگیری بیشتر درباره DataFrameها می‌توانید اینجا را دنبال نمایید.

نکات مهم در کار با DataFrame

  • همیشه نوع داده‌های هر ستون را بررسی کنید (dtypes)
  • برای داده‌های بزرگ، از روش‌های بهینه استفاده نمایید
  • قبل از ذخیره، حتماً مسیر فایل را بررسی کنید
  • برای فایل‌های فارسی از encoding مناسب استفاده کنید

با رعایت این نکات و استفاده صحیح از DataFrameها، می‌توانید به راحتی با داده‌های جدولی کار کنید و آن‌ها را در قالب‌های مختلف ذخیره نمایید.