این دوره به طور کامل تکنیکهای پیشپردازش دادهها و تبدیلهای موجود در Sicit-Learn را پوشش میدهد و امکان ساخت ویژگیهای بسیار بهینهشده را میدهد که به روشهای ریاضی درستی مقیاسبندی، نرمالسازی و تبدیل میشوند تا به طور کامل از قدرت تکنیکهای یادگیری ماشین استفاده شود.
آنچه یاد میگیری:
کیفیت پیش پردازشی که دادههای عددی تحت آن قرار میگیرند، تعیین کننده مهمی در نتایج مدلهای یادگیری ماشینی است که با استفاده از آن دادهها ساخته شدهاند. با پیش پردازش دادههای هوشمند و بهینه، میتوانید به طور قابل توجهی سرعت آموزش و اعتبارسنجی مدل را افزایش دهید، در زمان و هزینه صرفه جویی کنید و همچنین عملکرد مدل را در پیش بینی بسیار بهبود بخشید.
نمونه ویدیوی آموزشی ( زیرنویسها جدا از ویدیو است و میتوانید آنرا نمایش ندهید ) :
[ENGLISH]
01 Course Overview [2mins]
01-01 Course Overview [2mins]
02 Using Numeric Data in Machine Learning Algorithms [54mins]
02-01 Version Check [0mins]
02-02 Module Overview [1mins]
02-03 Prerequisites and Course Outline [2mins]
02-04 Scaling and Standardization [4mins]
02-05 Mean, Variance, and Standard Deviation [4mins]
02-06 Understanding Variance [4mins]
02-07 Demo- Calculating Mean, Variance, and Standard Deviation [7mins]
02-08 Demo- Box Plot Visualization and Data Standardization [7mins]
02-09 Standard Scaler [4mins]
02-10 Demo- Standardize Data Using the Scale Function [5mins]
02-11 Demo- Standardize Data Using the Standard Scalar Estimator and Apply Bessels Correction [4mins]
02-12 Robust Scaler [4mins]
02-13 Demo- Scaling Data Using the Robust Scaler [7mins]
02-14 Summary [1mins]
03 Building Features Using Normalization [35mins]
03-01 Module Overview [1mins]
03-02 What Is Normalization [2mins]
03-03 Normalization and Cosine Similarity [8mins]
03-04 Demo- Cosine Similarity and the L2 Norm [7mins]
03-05 Demo- Normalizing Data to Simplify Cosine Similarity Calculations [4mins]
03-06 Demo- K-means Clustering with Cosine Similarity [4mins]
03-07 L1, L2 and Max Norms [3mins]
03-08 Demo- Normalization Using L1, L2 and Max Norms [5mins]
03-09 Summary [1mins]
04 Building Features Using Scaling and Transformations [54mins]
04-01 Module Overview [1mins]
04-02 Converting Continuous Data to Categorical [3mins]
04-03 Demo- Convert Numeric Data to Binary Categories Using a Binarizer [5mins]
04-04 Demo- Using the KBinsDiscretizer to Categorize Numeric Values [6mins]
04-05 Demo- Using Bin Values to Flag Outliers [3mins]
04-06 Scaling Data [2mins]
04-07 Demo- Scaling with the MaxAbsScaler [2mins]
04-08 Demo- Scaling with the MinMaxScaler [3mins]
04-09 Custom Transformations [1mins]
04-10 Demo- Performing Custom Transforms Using the FunctionTransformer [3mins]
04-11 Generating Polynomial Features [2mins]
04-12 Demo- Using Polynomial Features to Transform Data [6mins]
04-13 Transforming Features to Gaussian-like Distributions Using Power Transformers [1mins]
04-14 Demo- Working with Chi Squared Distributed Input Features [5mins]
04-15 Demo- Applying Power Transformers to Get Normal Distributions [4mins]
04-16 Transforming Data to Normal or Uniform Distributions Using Quantile Transformers [1mins]
04-17 Demo- Tranforming to a Normal Distribution Using the QuantileTransformer [4mins]
04-18 Summary and Further Study [2mins]
[فارسی]
01 بررسی اجمالی دوره [2 دقیقه]
01-01 بررسی اجمالی دوره [2 دقیقه]
02 استفاده از دادههای عددی در الگوریتمهای یادگیری ماشین [54 دقیقه]
02-01 بررسی نسخه [0 دقیقه]
02-02 نمای کلی ماژول [1 دقیقه]
02-03 پیش نیازها و خلاصه دوره [2 دقیقه]
02-04 مقیاسبندی و استانداردسازی [4 دقیقه]
02-05 میانگین، واریانس و انحراف معیار [4 دقیقه]
02-06 درک واریانس [4 دقیقه]
02-07 نسخه نمایشی- محاسبه میانگین، واریانس و انحراف استاندارد [7 دقیقه]
02-08 نسخهی نمایشی- تصویرسازی باکس پلات و استانداردسازی دادهها [7 دقیقه]
02-09 مقیاسکننده استاندارد [4 دقیقه]
02-10 نسخهی نمایشی- استاندارد کردن دادهها با استفاده از تابع مقیاس [5 دقیقه]
02-11 نسخهی نمایشی- استاندارد کردن دادهها با استفاده از تخمینگر اسکالر استاندارد و اعمال تصحیح بیسل [4 دقیقه]
02-12 مقیاس کننده قوی [4 دقیقه]
02-13 نسخهی نمایشی- مقیاسبندی دادهها با استفاده از مقیاس کننده قوی [7 دقیقه]
02-14 خلاصه [1 دقیقه]
03 ویژگیهای ساختمان با استفاده از عادیسازی [35 دقیقه]
03-01 نمای کلی ماژول [1 دقیقه]
03-02 عادیسازی چیست؟ [2 دقیقه]
03-03 عادیسازی و شباهت کسینوس [8 دقیقه]
03-04 نسخهی نمایشی- شباهت کسینوس و هنجار L2 [7 دقیقه]
03-05 نسخهی نمایشی- عادیسازی دادهها برای ساده کردن محاسبات شباهت کسینوس [4 دقیقه]
03-06 نسخهی نمایشی- K-means خوشهبندی با شباهت کسینوس [4 دقیقه]
03-07 هنجارهای L1، L2 و حداکثر [3 دقیقه]
03-08 نسخهی نمایشی- عادیسازی با استفاده از هنجارهای L1، L2 و حداکثر [5 دقیقه]
03-09 خلاصه [1 دقیقه]
04 ویژگیهای ساختمان با استفاده از مقیاسبندی و تبدیل [54 دقیقه]
04-01 نمای کلی ماژول [1 دقیقه]
04-02 تبدیل دادههای پیوسته به دستهبندی [3 دقیقه]
04-03 نسخهی نمایشی- تبدیل دادههای عددی به دستههای باینری با استفاده از باینریزر [5 دقیقه]
04-04 نسخهی نمایشی- استفاده از KBinsDiscretizer برای دستهبندی مقادیر عددی [6 دقیقه]
04-05 نسخهی نمایشی- استفاده از مقادیر Bin برای پرچم گذاری نقاط پرت [3 دقیقه]
04-06 مقیاسبندی دادهها [2 دقیقه]
04-07 نسخهی نمایشی- مقیاسبندی با MaxAbsScaler [2 دقیقه]
04-08 نسخهی نمایشی- مقیاسبندی با MinMaxScaler [3 دقیقه]
04-09 تغییرات سفارشی [1 دقیقه]
04-10 نسخهی نمایشی- انجام تبدیلهای سفارشی با استفاده از FunctionTransformer [3 دقیقه]
04-11 ایجاد ویژگیهای چند جملهای [2 دقیقه]
04-12 نسخهی نمایشی- استفاده از ویژگیهای چند جملهای برای تبدیل دادهها [6 دقیقه]
04-13 تبدیل ویژگیها به توزیعهای گاوس مانند با استفاده از ترانسفورماتورهای قدرت [1 دقیقه]
04-14 نسخهی نمایشی- کار با ویژگیهای ورودی توزیع شده Chi Squared [5 دقیقه]
04-15 نسخهی نمایشی- استفاده از ترانسفورماتورهای قدرت برای دریافت توزیعهای عادی [4 دقیقه]
04-16 تبدیل دادهها به توزیعهای معمولی یا یکنواخت با استفاده از ترانسفورماتورهای کوانتیل [1 دقیقه]
04-17 نسخهی نمایشی- تبدیل به یک توزیع عادی با استفاده از QuantileTransformer [4 دقیقه]
04-18 خلاصه و مطالعه بیشتر [2 دقیقه]
جانانی دارای مدرک کارشناسی ارشد از استنفورد است و بیش از 7 سال در گوگل کار کرده است. او یکی از مهندسان اصلی Google Docs بود و دارای 4 پتنت برای فریمورک ویرایش مشارکتی بلادرنگ آن است. جانانی پس از گذراندن سالها کار در فناوری در منطقه خلیج، نیویورک و سنگاپور در شرکتهایی مانند مایکروسافت، گوگل و فلیپکارت، سرانجام تصمیم گرفت عشق خود به فناوری را با علاقهاش به تدریس ترکیب کند. او اکنون یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارتهای فنی متمرکز است. Loonycorn در حال کار بر روی توسعه یک موتور (پتنت ثبت شده) برای خودکارسازی انیمیشنها برای ارائهها و محتوای آموزشی است.