در این دوره آموزشی، جدال داده با پایتون 3، با توابع و رویههای مختلفی آشنا میشوید که به شما کمک میکند تا دادههای خود را مرتب کنید، و یک مجموعه داده تمیز و خوب برای تجزیه و تحلیل دادهها و یادگیری ماشینی بیشتر ارائه میدهد.
> آنچه یاد خواهید گرفت:
یادگیری ماشین و تجزیه و تحلیل دادهها به طور کلی از اصل زباله در/خروج زباله پیروی میکند. اگر میخواهید از دادههای خود یاد بگیرید یا پیشبینی کنید، باید مطمئن شوید که دادهها به خوبی ساخته و تمیز شدهاند. هدف این دوره آموزشی، جدال داده با پایتون 3، کمک به شما در انجام این کار است. ابتدا، نحوه ادغام دادهها از منابع مختلف را با استفاده از روشهای concat، append و merge خواهید دید. در مرحله بعد، نحوه ترکیب دادهها را در گروهها خواهید فهمید. تابع اصلی مورد استفاده در اینجا groupby است. در دو بخش بعدی، نحوه تبدیل و عادیسازی دادهها را بررسی خواهید کرد. شما یاد خواهید گرفت که چرا این فرآیندها ضروری هستند، و سپس به نحوه عملکرد آنها در عمل ادامه دهید. در نهایت، فرآیندهای مهمی مانند One Hot Encoding را بررسی خواهید کرد که پردازش بیشتر در طول تجزیه و تحلیل دادهها را امکان پذیر میکند. وقتی این دوره را به پایان رساندید، دانش کاملی در مورد بحث و جدل دادهها خواهید داشت که در طول پروژههای تجزیه و تحلیل دادهها و یادگیری ماشین به شما کمک زیادی میکند.
نمونه ویدیوی آموزشی ( زیرنویسها جدا از ویدیو است و میتوانید آنرا نمایش ندهید ) :
[ENGLISH]
01 Course Overview [2mins]
01-01 Course Overview [2mins]
02 Concatenating and Merging Data from Different Sources [23mins]
02-01 Version Check [0mins]
02-02 Course and Module Introduction [2mins]
02-03 Software and Course Prerequisites [1mins]
02-04 Concatenating Datasets [6mins]
02-05 Merging Datasets [5mins]
02-06 Merge Keys [3mins]
02-07 The How Parameter [3mins]
02-08 Demo: Disambiguating Merged Columns and Updating Dataframes [2mins]
02-09 Summary [1mins]
03 Combining Data into Groups [13mins]
03-01 Module Introduction [1mins]
03-02 The GroupBy Function [3mins]
03-03 Demo: Why and How to Use the GroupBy Function [4mins]
03-04 Filter and Transform with GroupBy [3mins]
03-05 Demo: Grouping Multi-index Data [2mins]
04 Normalizing Data with Pandas [11mins]
04-01 Module Introduction [1mins]
04-02 Normalizing Data - What and Why [2mins]
04-03 Simple Feature Scaling [2mins]
04-04 Min-max Scaling [2mins]
04-05 Z-score Normalization [2mins]
04-06 Points to Consider for Data Normalization and Summary [2mins]
05 Reshaping Data with Python [15mins]
05-01 Module Introduction [1mins]
05-02 Introduction to Data Reshaping [3mins]
05-03 Reshape Long Data to Wide Data with the Pivot Function [3mins]
05-04 Reshape Wide Data to Long Using the Melt Function [2mins]
05-05 Reshape Data Using the Stack and Unstack Functions [3mins]
05-06 Reshaping and Aggregation with Pivot Table [2mins]
05-07 Summary [1mins]
06 Data Encoding with Python [15mins]
06-01 Module Introduction [1mins]
06-02 One-hot Encoding [3mins]
06-03 Demo: Convert Categorical Values Using One-hot Encoding [3mins]
06-04 Create Dummy Variables with Pandas [3mins]
06-05 Create Frequency Table with the Crosstab Function [4mins]
06-06 Summary and Feedback [1mins]
[فارسی]
01 بررسی اجمالی دوره [2 دقیقه]
01-01 بررسی اجمالی دوره [2 دقیقه]
02 الحاق و ادغام دادهها از منابع مختلف [23 دقیقه]
02-01 بررسی نسخه [0 دقیقه]
02-02 معرفی دوره و ماژول [2 دقیقه]
02-03 نرمافزار و پیش نیازهای دوره [1 دقیقه]
02-04 به هم پیوستن مجموعه دادهها [6 دقیقه]
02-05 ادغام مجموعه دادهها [5 دقیقه]
02-06 کلیدهای ادغام [3 دقیقه]
02-07 پارامتر How [3 دقیقه]
02-08 نسخه آزمایشی- ابهامزدایی از ستونهای ادغام شده و بهروزرسانی فریمهای داده [2 دقیقه]
02-09 خلاصه [1 دقیقه]
03 ترکیب دادهها در گروهها [13 دقیقه]
03-01 معرفی ماژول [1 دقیقه]
03-02 عملکرد GroupBy [3 دقیقه]
03-03 نسخهی نمایشی- چرا و نحوه استفاده از عملکرد GroupBy [4 دقیقه]
03-04 فیلتر و تبدیل با GroupBy [3 دقیقه]
03-05 نسخهی نمایشی- گروهبندی دادههای چند شاخص [2 دقیقه]
04 عادیسازی دادهها با Pandas [11 دقیقه]
04-01 معرفی ماژول [1 دقیقه]
04-02 عادیسازی دادهها - چه چیزی و چرا [2 دقیقه]
04-03 مقیاسبندی ویژگی ساده [2 دقیقه]
04-04 حداقل حداکثر مقیاس [2 دقیقه]
04-05 عادیسازی امتیاز Z [2 دقیقه]
04-06 نکاتی که برای عادیسازی و خلاصهسازی دادهها باید در نظر گرفته شود [2 دقیقه]
05 تغییر شکل دادهها با پایتون [15 دقیقه]
05-01 معرفی ماژول [1 دقیقه]
05-02 مقدمهای بر تغییر شکل داده [3 دقیقه]
05-03 با تابع Pivot، دادههای طولانی را به دادههای گسترده تغییر شکل دهید [3 دقیقه]
05-04 با استفاده از عملکرد ذوب دادههای گسترده را به طولانی تبدیل کنید [2 دقیقه]
05-05 تغییر شکل داده با استفاده از توابع Stack و Unstack [3 دقیقه]
05-06 تغییر شکل و تجمع با جدول محوری [2 دقیقه]
05-07 خلاصه [1 دقیقه]
06 رمزگذاری دادهها با پایتون [15 دقیقه]
06-01 معرفی ماژول [1 دقیقه]
06-02 رمزگذاری یکباره [3 دقیقه]
06-03 نسخهی نمایشی- تبدیل مقادیر طبقهبندی با استفاده از رمزگذاری یکباره [3 دقیقه]
06-04 ایجاد متغیرهای ساختگی با Pandas [3 دقیقه]
06-05 ایجاد جدول فرکانس با عملکرد Crosstab [4 دقیقه]
06-06 خلاصه و بازخورد [1 دقیقه]
پراترث یک دانشمند داده است که پس از ترکیبی التقاطی از تجربیات آموزشی و کاری وارد این عرصه شده است. او دارای لیسانس مهندسی در مکاترونیک از هند، کارشناسی ارشد در مدیریت مهندسی از استرالیا و سپس زوج سال تجربه کاری به عنوان مهندس تولید در خاورمیانه است. سپس وقتی حشره A.I او را گاز گرفت، همه چیز را رها کرد تا زندگی خود را وقف میدان کند. او در حال حاضر به عنوان یک دانشمند داده بر روی مربیگری، ایجاد دوره و کار آزاد کار میکند.