عموماًداده کاوی فرایندی ازآنالیز داده از دیدهای مختلف وسپس خلاصه کردن آنها به صورت اطلاعات مفید می باشد . اطلاعات بدست آمده برای بالا بردن بازده، کاهش قیمت یا هردوبه کار می رود. نرم افزارdata mining یکی از ابزارهای متعدد آنالیز برای آنالیز کردن داده می باشد و به کاربراجازه می دهد که داده را از زوایا یا دیمانسیونهای مختلفی آنالیز کند. سپس آنها را دسته بندی کند و نهایتاً ارتباطات شناخته شده را خلاصه وجمع بندی کند. از لحاظ تکنیکی، data mining فرایندی ازجستجوی همبستگی یا طرح بین مجموعه بسیارزیادی ازفیلدها درپایگاه داده های رابطه ای بزرگ می باشد .Data Mining درگیر به کارگیری ابزارهای آنالیز داده برای یافتن و نمایش ناشناخته های قبلی، ارتباطات و طرحهای معتبر در مجموعه داده ای بزرگ می باشد.
Data Mining در بخشهای عمومی و خصوصی به صورت رایج به کار برده می شود. صنایعی نظیر دارو ، اقتصاد،بانک و … از Data Mining برای کاهش هزینه ها، بالابردن کیفیت و بالا بردن فروش استفاده می کنند. در بخش عمومی، نیز در وهله اول به عنوان ارزیابی زیان و ضرر و منفعت به کار برده می شود.
برای مثال یک سبزی فروشی زنجیره ای ازخاصیت data mining درنرم افزار اوراکل برای آنالیز طرحهای خرید محلی استفاده نمود. آنها به این واقعیت پی بردند که زمانی که افراد درروزهای شنبه و سه شنبه سیب زمینی می خرند،تمایل به خرید پیاز هم دارند. آنالیزهای بعدی نشان داد که خریداران معمولاً خرید هفتگی خودرا در روزهای شنبه انجام می دهند و در روزهای سه شنبه تنها مقدار کمی خرید می کنند.
از دید برخی متخصصین ، Data Mining به عنوان یک گام در یک فرایند شناخت بزرگتر با نام Knowledge discovery database (KDD) مطرح می شود میتوانید مطلب مفاهیم داده کاوی را دنبال کنید
می توان در یک دسته بندی کلی گامها در فرایند KDD ، به ترتیب پیشرفت ،را به صورت زیر برشمرد :
- Data Cleaninig
- Data Integration
- Data Selection
- Data Transformation
- Data Mining
- Pattern Evaluation
- Knowledge Presentation