عنوان: داده کاوی مفهوم و کاربرد آن در آموزش عالی پایان نامه
داده کاوی مفهوم و کاربرد آن در آموزش عالی
تجزیه و تحلیل داده ها فرآیند بازرسی، پاکسازی، تبدیل و مدل سازی داده ها با هدف کشف اطلاعات مفید، اطلاع رسانی نتیجه گیری و حمایت از تصمیم گیری است.
تجزیه و تحلیل دادهها جنبهها و رویکردهای متعددی دارد و تکنیکهای متنوعی را تحت نامهای مختلف در بر میگیرد و در حوزههای مختلف تجاری، علمی و علوم اجتماعی استفاده میشود.
در دنیای تجارت امروز، تجزیه و تحلیل دادهها در تصمیمگیری علمیتر و کمک به کسبوکارها برای عملکرد مؤثرتر نقش دارد.
داده کاوی یک تکنیک تجزیه و تحلیل داده خاص است که بر مدلسازی آماری و کشف دانش برای اهداف پیشبینیکننده و نه صرفاً توصیفی تمرکز دارد، در حالی که هوش تجاری تجزیه و تحلیل دادهها را پوشش میدهد که به شدت بر تجمیع، متمرکز بر اطلاعات تجاری متمرکز است.
در کاربردهای آماری، تجزیه و تحلیل داده ها را می توان به آمار توصیفی، تجزیه و تحلیل داده های اکتشافی (EDA) و تجزیه و تحلیل داده های تاییدی (CDA) تقسیم کرد.[5] EDA بر کشف ویژگیهای جدید در دادهها تمرکز دارد در حالی که CDA بر تأیید یا جعل فرضیههای موجود تمرکز دارد.
تجزیه و تحلیل پیشبینیکننده بر کاربرد مدلهای آماری برای پیشبینی یا طبقهبندی پیشبینیکننده تمرکز دارد، در حالی که تجزیه و تحلیل متن از تکنیکهای آماری، زبانی و ساختاری برای استخراج و طبقهبندی اطلاعات از منابع متنی، گونهای از دادههای بدون ساختار استفاده میکند. همه موارد فوق انواعی از تجزیه و تحلیل داده ها هستند.
یکپارچه سازی داده ها پیشروی برای تجزیه و تحلیل داده ها است، و تجزیه و تحلیل داده ها ارتباط نزدیکی با تجسم داده ها و انتشار داده ها دارد.
فرآیند تجزیه و تحلیل داده ها
فلوچارت فرآیند علم داده از Doing Data Science، توسط Schutt & O’Neil (2013)
تحلیل به تقسیم یک کل به اجزای جداگانه آن برای بررسی فردی اشاره دارد. تجزیه و تحلیل داده ها فرآیندی برای به دست آوردن داده های خام و متعاقبا تبدیل آن به اطلاعات مفید برای تصمیم گیری توسط کاربران است.داده ها برای پاسخ به سؤالات، آزمون فرضیه ها یا رد نظریه ها جمع آوری و تجزیه و تحلیل می شوند.
جان توکی، آماردان، تحلیل داده ها را در سال 1961 چنین تعریف کرد:
«روشهای تجزیه و تحلیل دادهها، تکنیکهایی برای تفسیر نتایج چنین رویههایی، روشهای برنامهریزی جمعآوری دادهها برای آسانتر، دقیقتر یا دقیقتر کردن تجزیه و تحلیل آنها، و تمام ماشینآلات و نتایج آمار (ریاضی) که برای تجزیه و تحلیل دادهها اعمال میشود.