Skip to content

Home
Tutorials
Papers
MCQs
Contact

Holdout method for evaluating a classifier in data mining
By: Prof. Dr. Fazal Rehman | Last updated: March 3, 2022

Holdout method:

All data is randomly divided into same equal size data sets. e.g,

Training set
Test set
Validation set

Training set:

It is a data set helps in the prediction of the model.

[quads id=1]

Test set:

Unseen data is used as a subset of the data set to assess the performance of the model.

Validation set:

The validation set is also a data set used to assess the performance of model built during the training.

For example; There are total 3 data sets. Total training set for model construction

2/3

Total test set for accuracy estimation

1/3

Next Similar Tutorials

Decision tree induction on categorical attributes – Click Here
Decision Tree Induction and Entropy in data mining – Click Here
Overfitting of decision tree and tree pruning – Click Here
Attribute selection Measures – Click Here
Computing Information-Gain for Continuous-Valued Attributes in data mining – Click Here
Gini index for binary variables – Click Here
Bagging and Bootstrap in Data Mining, Machine Learning – Click Here
Evaluation of a classifier by confusion matrix in data mining – Click Here
Holdout method for evaluating a classifier in data mining – Click Here
RainForest Algorithm / Framework – Click Here
Boosting in data mining – Click Here
Naive Bayes Classifier – Click Here

Related Posts:

naive bayes classifier tutorial in data mining
Evaluation of a classifier by confusion matrix in data mining
Data mining normalization method
Classifier, cataloguer Past Papers PPSC [Pakistan]
SQL Programming for Data Mining for Data Mining MCQs
What is data mining? What is not data mining?

Leave a Comment

You must be logged in to post a comment.

Data Mining

Introduction
Data that can be Mined?
Data Quality in Data Preprocessing for Data Mining
Data Pre-Processing
Data Cleaning
Binning Methods for Data Smoothing
binning data in excel
Data discretization
Dimensionality Reduction
Data Normalization
Z-Score Normalization
Decimal scaling Normalization
Min Max Normalization
Data Understanding
attributes types
Mean, Median, Mode
Grouped Data
Data Quartiles
Quantile-Quantile Plot
Outliers in Data mining
data skewness
Correlation analysis of numerical data
Proximity Measure for Nominal Attributes
Chi-Square Test
Similarity and Distance
Similarity and Distance
Jaccard coefficient similarity measure
TF IDF Cosine similarity Formula Examples in data mining
Distance measure for asymmetric binary
Distance measure for symmetric binary
Euclidean distance
Classification
C4.5
KNN algorithm in data mining with examples
Clustering
Association rule mining
Regression
MCQs
attribute selection measure
euclidean distance
Variance and standard deviation
Major tasks of data pre-processing
Data Mining Primitives
Analytical Characterization in Data Mining
Data Generalization In Data Mining – Summarization Based Characterization
Prime Factors
Data Mining Research Topics for MS PhD
Computer Science Research Topics for MS PhD
Interview questions Data Mining

MCQs – Computer Science
MCQs – English
MCQs – Biology
MCQs – Everyday Science
MCQs – General Knowledge
MCQs – Islamic studies
MCQs – Maths
MCQs – Physics
MCQs – Geography
MCQs – Economics
MCQs – Statistics
MCQs – Ethics
MCQs – Management Sciences
MCQs – Social Studies
Engineering MCQs
[1000+] Psychology MCQs
Laser marking MCQs
Analogy MCQs

Search for:

All Copyrights Reserved 2025 Reserved by T4Tutorials