بخش 5. آمار و تحلیل دادهها
فصل 1. آمار توصیفی
-
معرفی آمار توصیفی و کاربرد آن در دادهکاوی
-
شاخصهای مرکزی: میانگین، میانه، نما
-
شاخصهای پراکندگی: واریانس، انحراف معیار، دامنه
-
شاخصهای شکل توزیع: چولگی و کشیدگی
-
تحلیل جداول توزیع فراوانی و نمودارهای پایه
فصل 2. احتمال و توزیعهای آماری
-
مفاهیم پایه احتمال و قوانین آن
-
رویدادهای مستقل و وابسته
-
توزیعهای گسسته: برنولی، بینومیال، پواسون
-
توزیعهای پیوسته: نرمال، نمایی، یکنواخت
-
استفاده از توزیعها برای مدلسازی دادهها
فصل 3. همبستگی و کوواریانس
-
تعریف همبستگی و کاربرد آن در تحلیل دادهها
-
ضریب همبستگی پیرسون و اسپیرمن
-
تحلیل رابطه بین دو یا چند متغیر
-
مفهوم کوواریانس و تفاوت آن با همبستگی
-
تحلیل ماتریس همبستگی برای دادههای چندمتغیره
فصل 4. آزمونهای آماری پایه
-
اهمیت آزمونهای آماری در تصمیمگیری دادهمحور
-
آزمون فرضیه و انواع خطاهای آماری (Type I و II)
-
آزمون t برای میانگینها
-
آزمون χ² برای دادههای دستهای
-
آزمون ANOVA برای مقایسه چند گروه
-
بررسی پیشفرضها و شرایط استفاده از آزمونها
فصل 5. تحلیل دادهها با کتابخانههای Python
-
معرفی ابزارهای Python برای تحلیل آماری
-
استفاده از Pandas برای محاسبات آماری ساده
-
تحلیل توزیع دادهها با SciPy
-
بررسی روندها و شناسایی الگوهای آماری
-
کاربرد آمار توصیفی و آزمونها در تحلیل پروژههای واقعی
بخش 6. پیشپردازش دادهها و Feature Engineering
فصل 1. مدیریت دادههای گمشده و ناهماهنگ
-
شناسایی دادههای گمشده و ناهماهنگ در دیتافریمها
-
بررسی الگوهای دادههای ناقص و دلیل وجود آنها
-
تکنیکهای جایگزینی دادههای گمشده (میانگین، میانه، مد، روش پیشرفته)
-
حذف دادههای ناقص و پیامدهای آن بر مدل
فصل 2. نرمالسازی و استانداردسازی دادهها
-
ضرورت مقیاسبندی دادهها در یادگیری ماشین
-
تفاوت بین نرمالسازی و استانداردسازی
-
تبدیل دادهها به بازههای مشخص برای بهبود عملکرد مدل
-
کاربردهای نرمالسازی و استانداردسازی در مدلهای مختلف
فصل 3. کدگذاری دادههای دستهای
-
شناسایی ویژگیهای دستهای (Categorical Features)
-
روش Label Encoding و کاربرد آن
-
روش One-Hot Encoding و مزایا/معایب آن
-
تکنیکهای پیشرفته برای کدگذاری ویژگیها (Target Encoding، Binary Encoding)
فصل 4. انتخاب ویژگیها (Feature Selection)
-
اهمیت کاهش تعداد ویژگیها برای بهبود دقت مدل و کاهش پیچیدگی
-
روشهای مبتنی بر آمار (Correlation, Chi-Square)
-
روشهای مبتنی بر مدل (Feature Importance, Recursive Feature Elimination)
-
انتخاب ویژگیهای نهایی و آمادهسازی برای مدل
فصل 5. کاهش ابعاد دادهها (Dimensionality Reduction)
-
ضرورت کاهش ابعاد و تاثیر آن بر سرعت و دقت مدل
-
معرفی Principal Component Analysis (PCA)
-
کاربرد PCA در کاهش ابعاد و مصورسازی دادهها
-
سایر روشهای کاهش ابعاد (t-SNE, LDA)
فصل 6. شناسایی و حذف دادههای پرت (Outlier Detection)
-
تعریف دادههای پرت و تاثیر آنها بر مدلها
-
روشهای شناسایی دادههای پرت (IQR, Z-Score, Visualization)
-
تصمیمگیری درباره حذف یا اصلاح دادههای پرت
-
نکات عملی برای مدیریت دادههای پرت در پروژههای واقعی
بخش 7. Machine Learning با Python
فصل 1. مقدمهای بر Machine Learning
-
تعریف Machine Learning و تفاوت با برنامهنویسی سنتی
-
کاربردهای Machine Learning در دنیای واقعی
-
انواع یادگیری: Supervised, Unsupervised, Reinforcement
-
چرخه زندگی یک پروژه Machine Learning
فصل 2. پیشپردازش دادهها برای یادگیری ماشین
-
پاکسازی دادهها و مدیریت دادههای گمشده
-
نرمالسازی و استانداردسازی دادهها
-
کدگذاری ویژگیهای دستهای (One-Hot Encoding و Label Encoding)
-
تقسیم دادهها به مجموعه آموزش و آزمون
-
تشخیص و حذف دادههای پرت و نویز
فصل 3. مدلهای Supervised Learning
-
Linear Regression: مفاهیم پایه، فرضیات، کاربردها
-
Logistic Regression: پیشبینی دستهبندیها، تفسیر نتایج
-
Decision Trees: ساختار، تقسیمبندی، مزایا و محدودیتها
-
Random Forest: افزایش دقت با ترکیب چندین درخت تصمیم
-
Support Vector Machines (SVM): تشخیص مرزهای تصمیم، کاربردها و مزایا
فصل 4. مدلهای Unsupervised Learning
-
K-Means Clustering: خوشهبندی دادهها، انتخاب تعداد خوشهها، تفسیر نتایج
-
Hierarchical Clustering: خوشهبندی سلسلهمراتبی و نمودار درختی
-
Principal Component Analysis (PCA): کاهش ابعاد، شناسایی ویژگیهای مهم
-
DBSCAN و سایر الگوریتمهای خوشهبندی: کاربرد در دادههای پیچیده
فصل 5. ارزیابی و بهبود مدلها
-
مفاهیم Train/Test Split و Cross Validation
-
معیارهای سنجش عملکرد: Accuracy، Precision، Recall، F1 Score
-
ماتریس سردرگمی (Confusion Matrix) و تفسیر آن
-
Overfitting و Underfitting: شناسایی و جلوگیری
-
بهبود مدلها با تکنیکهای Regularization (L1, L2)
فصل 6. تکنیکهای پیشرفته و بهینهسازی مدلها
-
Grid Search و Random Search برای انتخاب هایپرپارامترها
-
Ensemble Learning: ترکیب مدلها برای افزایش دقت
-
Boosting و Bagging: مزایا و کاربردها
-
یادگیری تقویتی (Reinforcement Learning) – معرفی مفهومی
-
کاربرد Machine Learning در دادههای بزرگ و واقعی
بخش 8. پیشرفته: Deep Learning و Neural Networks
فصل 1. مقدمهای بر Deep Learning
-
تفاوت بین Machine Learning و Deep Learning
-
کاربردهای عملی Deep Learning در صنعت و پژوهش
-
آشنایی با شبکههای عصبی مصنوعی (Artificial Neural Networks)
فصل 2. ساختار و معماری شبکههای عصبی
-
لایهها و نورونها: ورودی، پنهان و خروجی
-
توابع فعالسازی (Activation Functions) و اهمیت آنها
-
مفهوم وزنها و بایاسها در شبکه عصبی
-
الگوریتمهای یادگیری و بهینهسازی (Optimization)
فصل 3. آموزش شبکههای عصبی
-
فرآیند Feedforward و Backpropagation
-
مفهوم Loss Function و تابع هزینه
-
Gradient Descent و روشهای بهینهسازی پیشرفته
-
جلوگیری از Overfitting: Regularization و Dropout
فصل 4. شبکههای کانولوشنی (CNN)
-
مفهوم Convolution و Pooling
-
ساختار لایههای CNN و کاربرد آنها
-
کاربرد CNN در پردازش تصویر و ویدئو
-
مثالهای عملی برای تشخیص تصویر
فصل 5. شبکههای بازگشتی (RNN) و LSTM
-
مفهوم حافظه در شبکههای بازگشتی
-
کاربرد RNN در دادههای زمانی و متنی
-
معماری LSTM برای دادههای سری زمانی
-
مثالهای عملی در تحلیل سریهای زمانی و پردازش زبان طبیعی
فصل 6. بهینهسازی و ارزیابی مدلها
-
معیارهای ارزیابی شبکههای عصبی (Accuracy, Precision, Recall, F1 Score)
-
روشهای افزایش دقت مدلها
-
تکنیکهای Early Stopping و تنظیم هایپرپارامترها
-
استفاده از GPU و پردازش موازی برای افزایش سرعت آموزش
خدمات شبکه فراز نتورک | پیشرو در ارائه خدمات دیتاسنتری و کلود

نقد و بررسی وجود ندارد.