نحوه کاوش مجموعه دادههای جدید در R را با استفاده از یک طرح اولیه اکتشاف دادههای ساختاریافته و تثبیت شده بیاموزید.
آنچه خواهید آموخت:
آیا میخواهید یاد بگیرید که چگونه کاوش داده میتواند در R اجرا شود؟ بدون کاوش دادهها، کل فرآیند تجزیه و تحلیل دادهها ناکارآمد و کند میشود، اما یک فرآیند کاوش داده خوب را دنبال کنید و به بینشهای ارزشمندی هدایت خواهید شد. در این دوره آموزشی، Exploring Your First Data Set with R، خواهید آموخت که چگونه مجموعه دادههای جدید به روشی سریع و کارآمد کاوش و تجزیه و تحلیل میشوند. ابتدا، روشهای ذکر شده را به دنبال یک توالی منطقی، که در اکثر فریمهای داده استاندارد قابل اجرا هستند، یاد خواهید گرفت. سپس، متوجه خواهید شد که چگونه فرآیند به 3 مرحله تقسیم میشود: آمار خلاصه، بررسی توزیع و تجزیه و تحلیل رابطه. این مراحل بر روی یکدیگر ساخته میشوند و متوجه خواهید شد که کدام متغیرها ارزش تجزیه و تحلیل بیشتر را دارند و وابستگیهای متغیر در کجا وجود دارد. در نهایت، دانش کار زمینی برای یادگیری ماشین و ارائه دادههای نهایی را به دست خواهید آورد. هنگامی که این دوره را به پایان رساندید، مهارتهایی را خواهید داشت که به درستی ساختار و انجام کاوش دادهها را در R انجام دهید.
نمونه ویدیوی آموزشی ( زیرنویسها جدا از ویدیو است و میتوانید آنرا نمایش ندهید ) :
[ENGLISH]
01 Course Overview [2mins]
01-01 Course Overview [2mins]
02 Background on Exploratory Data Analysis [29mins]
02-01 Intro [2mins]
02-02 Managing Expectations [5mins]
02-03 The Data Science Steps [7mins]
02-04 Blueprint to Data Exploration [5mins]
02-05 R for Data Exploration [5mins]
02-06 Our Course Dataset [3mins]
02-07 Summary [2mins]
03 First Level Data Exploration [40mins]
03-01 Intro [2mins]
03-02 Summary Statistics [8mins]
03-03 Boxplots and Data Structure [8mins]
03-04 Probability Distributions [6mins]
03-05 Testing the Distribution [5mins]
03-06 Hypothesis Tests [8mins]
03-07 Summary [3mins]
04 Statistical Tests to Confirm Initial Findings [38mins]
04-01 Intro [2mins]
04-02 Relationships Between Variables: Overview [4mins]
04-03 Relations between Categorical and Numeric Variables [8mins]
04-04 Relations in Numeric Variables [6mins]
04-05 Visualizing Numeric Correlations [4mins]
04-06 Relations between Categorical Variables [6mins]
04-07 Comparing the Methods Used [6mins]
04-08 Summary [2mins]
05 Looking Ahead and Summary [20mins]
05-01 Intro [1mins]
05-02 The Steps after Exploration [4mins]
05-03 Alternative Datasets and Data Exploration [5mins]
05-04 Optimizing Your R Learning Experience [6mins]
05-05 Course Summary [4mins]
[فارسی]
01 بررسی اجمالی دوره [2 دقیقه]
01-01 بررسی اجمالی دوره [2 دقیقه]
02 پیشینه تجزیه و تحلیل دادههای اکتشافی [29 دقیقه]
02-01 مقدمه [2 دقیقه]
02-02 مدیریت انتظارات [5 دقیقه]
02-03 مراحل علم داده [7 دقیقه]
02-04 طرح اولیه برای کاوش داده [5 دقیقه]
02-05 R برای کاوش داده [5 دقیقه]
02-06 مجموعه دادههای دوره ما [3 دقیقه]
02-07 خلاصه [2 دقیقه]
03 کاوش دادههای سطح اول [40 دقیقه]
03-01 مقدمه [2 دقیقه]
03-02 آمار خلاصه [8 دقیقه]
03-03 نمودارهای جعبه و ساختار داده [8 دقیقه]
03-04 توزیع احتمالات [6 دقیقه]
03-05 آزمایش توزیع [5 دقیقه]
03-06 آزمونهای فرضیه [8 دقیقه]
03-07 خلاصه [3 دقیقه]
04 تستهای آماری برای تایید یافتههای اولیه [38 دقیقه]
04-01 مقدمه [2 دقیقه]
04-02 روابط بین متغیرها- بررسی اجمالی [4 دقیقه]
04-03 روابط بین متغیرهای مقولهای و عددی [8 دقیقه]
04-04 روابط در متغیرهای عددی [6 دقیقه]
04-05 تجسم همبستگیهای عددی [4 دقیقه]
04-06 روابط بین متغیرهای طبقهبندی [6 دقیقه]
04-07 مقایسه روشهای استفاده شده [6 دقیقه]
04-08 خلاصه [2 دقیقه]
05 نگاه به آینده و خلاصه [20 دقیقه]
05-01 مقدمه [1 دقیقه]
05-02 مراحل بعد از کاوش [4 دقیقه]
05-03 مجموعه دادههای جایگزین و کاوش داده [5 دقیقه]
05-04 بهینهسازی تجربه یادگیری R شما [6 دقیقه]
05-05 خلاصه دوره [4 دقیقه]
مارتین قبل از اینکه مشاور و نویسنده علوم داده شود، در رشته آمار زیستی تحصیل کرد و برای چندین شرکت داروسازی کار کرد. او بیش از 15 دوره در مورد R، Tableau 9 و سایر موضوعات مرتبط با علم داده منتشر کرد. تمرکز اصلی او بر روی نرم افزارهای تحلیلی مانند R و SPSS است، اما او همچنین به ابزارهای مدرن تجسم داده مانند Tableau علاقه مند است. اگر او مشغول کدنویسی، وبلاگ نویسی یا آموزش مفاهیم جدید نیست، ممکن است او را در حال اسکی یا پیاده روی در کوههای آلپ بیابید.