lec07 learning rate, data preprocessing overfitting

머신러닝,딥러닝/tensorflow

lec07 learning rate, data preprocessing overfitting

mcdn 2021. 1. 21. 15:46

cost function 값을 최소화하기 위해서 썼던 gradient descent

이때 0.001 정도의 learning rate 알파 값을 적용했었다.

만약 large learning rate 라면? ==> overshooting 발생

그리고 만약 small learning rate라면? ==> takes too long and stops at local minimum

그래서 try several learning rate

observe the cost function 0.01 -> 0.001 or 0.1 이렇게

(andrew ng 는 3배 단위로 크고 작게 하라 했었음)

data(x) preprocessing for gradient descent

예를 들어서 data(x) preprocessing for gradient descent

그러면 이렇게 눌린 산이 된다. 삐죽 삐죽 나오게 된다.

그래서 바꾼다.

zero-centered data - 0 is the center

normalized data - width height similar

standardization

code here

overfitting

our model is very good with training data set with memorization

not good for test dataset or in real use

구불구불하게 모든걸 들어맞는 fuction

solution for overfitting

- more training data

-reduce the number of features

- regularization

구불 선을 구부리지 말고 펴라는뜻

각각의 w를 더해서 너무 크게 차이나지 않도록 하는 거인듯??

알파를 곱해서 값을 더하는 걸 정할 수 있다.

summary

learning rate

data preprocessing

overfitting and solution(=regularization)

=================================

이제 머신러닝이 잘 작동하는지 확인하는 작업

performance evaluation : is this good?

evaluation using training set?

100% correct = accuracy

can memorize

시험을 보고 문제를 외워서 푸는 거나 다름 없다.

그러니까 training and test set을 나눠서 숨긴 상태.

우리는 Training set로 모델을 만들고

-> test set 으로 값을 테스트한다.

우리가 잘하는지 확인 가능

training, validation, and test sets

original set : training validation testing

validation 은 알파, 간마 값을 조정하는 단계에서 쓰이는 케이스들

테스트는 절대 모델에서 쓰이면 안된다.

온라인 learning 모델

100만개 넣었다면 10만개씩 넣는다.

게속 추가해서 축적해 모델에 추가하는 것

새로 들어와도 처음부터 다 노노

실제 데이터 Y 값과 우리 모델이 예측한 Yhat값이 같은지.

100개 중 90개가 같으면 90%겠지

실습 시작

training 으로 학습하고 모델 만듬. 테스트는 모델 입장에서 본적 없는 케이스여야

그럼 어떠헤 나누냐??

비슷해야..

'머신러닝,딥러닝 > tensorflow' 카테고리의 다른 글

lec10 xsigmoid 보다 ReLU가 더 좋아 (0)	2021.01.24
lec09 XOR 문제 딥러닝으로 풀기 (0)	2021.01.24
lec08 tensor manipulation(reshape, stack, zip, one_hot ..) (0)	2021.01.22
lec08 deep neural network for everyone (0)	2021.01.22
lec06 multinominal 개념 소개 (0)	2021.01.21
lec05 logistic (regression) classification (0)	2021.01.19
lec04 file읽어서 tf.model에 집어넣기 (0)	2021.01.19
lec04 multi-variable linear regression tensorflow (0)	2021.01.18

현재글lec07 learning rate, data preprocessing overfitting

tandem 협력 관계

티스토리글상자, docker, 대형컴퓨터학원, nipa온라인교육, KG아이티뱅크, VirtualBox, pandas기초강의, 글상자, 코딩과외, 더조은컴퓨터아카데미, 컴퓨터학원후기, incpetion42, 코멘투, 코딩학원가격, 팀단위컴퓨터학원, 코딩학원후기, 문과코딩, 코리아IT아카데미학원, numpy기초, inception42,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

코딩일기