بررسی تفاوت آرایه numpy و دیتافریم پانداز پایتون

امیرحسین بیگدلو 1 ماه قبل

ساختارهای پایتون ممکن است گاهی بسیار شبیه هم به نظر برسند و باعث سردرگمی شوند. دیتافرم های پانداز و آرایه های numpy دو ساختار مهم در تجزیه و تحلیل داده ها هستند. در این مقاله قصد داریم تفاوت های بین pandas dataframe و numpy array را بررسی کنیم.

دوره پیشنهادی: دوره آموزش numpy پایتون

# آرایه numpy چیست؟

آرایه NumPy نوعی ساختار داده چند بعدی در پایتون است که می تواند آبجکت هایی از انواع داده های مشابه را ذخیره کند. عناصر داخل آرایه با اعداد صحیح مثبت ایندکس میشوند. آرایه ها قابل تغییر هستند و بعد از ایجاد کردن آنها، میتوانید مقادیرشان را تغییر دهید. آرایه ها برای انجام عملیات ریاضی بر روی بردارها بسیار مفید هستند و متدهای مفید زیادی برای انجام عملیات برداری ارائه می دهند.

برای ایجاد کردن یک آرایه در numpy میتوانید به شکل زیر کار کنید:

>>> import numpy as np
>>> arr = np.array([1, 2, 3, 4, 5])
>>> arr
[1, 2, 3,4, 5]

دوره پیشنهادی: دوره آموزش pandas پایتون

# دیتافریم pandas چیست؟

DataFrame پانداز یک ساختار داده‌ای دو بعدی، جدولی و قابل تغییر در پایتون است که می‌تواند داده‌های جدولی حاوی آبجکت هایی از انواع داده‌های مختلف را ذخیره کند. یک DataFrame محورها را به شکل سطر و ستون برچسب گذاری میکند. دیتافریم ها ابزارهای مفیدی در پیش پردازش داده ها هستند زیرا روش های مفیدی را برای مدیریت داده ها ارائه می دهند. دیتافریم ها همچنین برای ایجاد جداول محوری و ترسیم نمودار با Matplotlib بسیار مفید هستند.

برای ساخت دیتافریم پانداز میتوانید به شکل زیر کار کنید:

>>> import pandas as pd

>>> df=pd.DataFrame({'Name':["Tommy","Linda","Justin","Brendon"], 'Age':[31,24,16,22]})
>>> df
      Name    Age
0    Tommy   31
1    Linda   24
2   Justin   16
3  Brendon   22

 

# تفاوت های دیتافریم و آرایه

تفاوت های دیتافریم های پانداز و آرایه نامپای به شکل زیر است:

1. آرایه های Numpy می توانند چند بعدی باشند در حالی که DataFrame فقط می تواند دو بعدی باشد.

2. آرایه ها باید آبجکت های مشابه را داخل خود ذخیره کنند اما دیتافریم های میتواند انواع آبجکت های مختلف را در خود ذخیره کنند.

3. هم آرایه و هم DataFrame قابل تغییر هستند.

4. DataFrame ها بیشتر به شکل جداول SQL هستند و با داده های جدولی همراه هستند در حالی که آرایه ها با داده های عددی و محاسبات مرتبط هستند.

5. دیتافریم ها می‌تواند با داده‌های پویا و انواع داده‌های مختلط سروکار داشته باشد، در حالی که آرایه‌ها انعطاف‌پذیری لازم برای مدیریت چنین داده‌هایی را ندارند.

مطالب مشابه



مونگارد