بررسی تفاوت آرایه numpy و دیتافریم پانداز پایتون
ساختارهای پایتون ممکن است گاهی بسیار شبیه هم به نظر برسند و باعث سردرگمی شوند. دیتافرم های پانداز و آرایه های numpy دو ساختار مهم در تجزیه و تحلیل داده ها هستند. در این مقاله قصد داریم تفاوت های بین pandas dataframe و numpy array را بررسی کنیم.
دوره پیشنهادی: دوره آموزش numpy پایتون
# آرایه numpy چیست؟
آرایه NumPy نوعی ساختار داده چند بعدی در پایتون است که می تواند آبجکت هایی از انواع داده های مشابه را ذخیره کند. عناصر داخل آرایه با اعداد صحیح مثبت ایندکس میشوند. آرایه ها قابل تغییر هستند و بعد از ایجاد کردن آنها، میتوانید مقادیرشان را تغییر دهید. آرایه ها برای انجام عملیات ریاضی بر روی بردارها بسیار مفید هستند و متدهای مفید زیادی برای انجام عملیات برداری ارائه می دهند.
برای ایجاد کردن یک آرایه در numpy میتوانید به شکل زیر کار کنید:
>>> import numpy as np
>>> arr = np.array([1, 2, 3, 4, 5])
>>> arr
[1, 2, 3,4, 5]
دوره پیشنهادی: دوره آموزش pandas پایتون
# دیتافریم pandas چیست؟
DataFrame پانداز یک ساختار دادهای دو بعدی، جدولی و قابل تغییر در پایتون است که میتواند دادههای جدولی حاوی آبجکت هایی از انواع دادههای مختلف را ذخیره کند. یک DataFrame محورها را به شکل سطر و ستون برچسب گذاری میکند. دیتافریم ها ابزارهای مفیدی در پیش پردازش داده ها هستند زیرا روش های مفیدی را برای مدیریت داده ها ارائه می دهند. دیتافریم ها همچنین برای ایجاد جداول محوری و ترسیم نمودار با Matplotlib بسیار مفید هستند.
برای ساخت دیتافریم پانداز میتوانید به شکل زیر کار کنید:
>>> import pandas as pd
>>> df=pd.DataFrame({'Name':["Tommy","Linda","Justin","Brendon"], 'Age':[31,24,16,22]})
>>> df
Name Age
0 Tommy 31
1 Linda 24
2 Justin 16
3 Brendon 22
# تفاوت های دیتافریم و آرایه
تفاوت های دیتافریم های پانداز و آرایه نامپای به شکل زیر است:
1. آرایه های Numpy می توانند چند بعدی باشند در حالی که DataFrame فقط می تواند دو بعدی باشد.
2. آرایه ها باید آبجکت های مشابه را داخل خود ذخیره کنند اما دیتافریم های میتواند انواع آبجکت های مختلف را در خود ذخیره کنند.
3. هم آرایه و هم DataFrame قابل تغییر هستند.
4. DataFrame ها بیشتر به شکل جداول SQL هستند و با داده های جدولی همراه هستند در حالی که آرایه ها با داده های عددی و محاسبات مرتبط هستند.
5. دیتافریم ها میتواند با دادههای پویا و انواع دادههای مختلط سروکار داشته باشد، در حالی که آرایهها انعطافپذیری لازم برای مدیریت چنین دادههایی را ندارند.