Data Science (51) 썸네일형 리스트형 [n422]Distributed Representation ■ Key words ㆍ단어의 분산표현(Distributed Representation) - one-hot encoding - embedding ㆍWord2Vec - CBoW / Skip-gram - Word2Vec의 임베딩 벡터 시각화 ㆍfastText - OOV(Out Of Vocabulary) 문제 - 철자(Chracter) 단위 임베딩 - padding ■ 주요내용 ㆍ단어의 분산표현(Distributed Representation) : 단어 자체를 벡터화 하는 방법 / 분포가설에 기반하여 주변 단어 분포를 기준으로 단어의 벡터표현 결정 - 분포 가설(Distribution hypothesis) : 비슷한 위치에서 등장하는 단어들은 비슷한 의미를 가진다는 가설 - one-hot encoding : .. [n421]Count-based Representation ■ Key words ㆍNPL(Natural Language Processing) : 자연어 이해(NLU) / 자연어 생성(NLG) - 말뭉치(Corpus) - 문서(Document) - 문장(Sentence) - 어휘집합(Vocabulary) ㆍ전처리(Preprocessing) - 토큰화(Tokenization) - 불용어(Stop words) - 어간 추출(stemming) / 표제어 추출(Lemmatization) ㆍ등장 횟수 기반의 단어 표현(Count-based Representation) - 문서-단어 행렬(Document-Term Matrix, DTM) / Bag-of-words - TF(Term Frequency) / TD-IDF(- Inverse Document Frequency) ■ 주.. [n414]Neural Network Hyperparameters ■ Key words ㆍParameter와 Hyperparameter ㆍExperiment Tracking Framework(ETF) ㆍRandomSearch ■ 주요내용 ㆍParameter와 Hyperparameter - Parameter : 좋은 예측(모델의 성능)을 위해 업데이트가(학습이) 돼야 하는 변수(i. e. 가중치 등) - Hyperparameter : 좋은 예측을 위해 사전에 지정하는 값(iteration, batch, epoch 수 등) ㆍ입력 데이터 정규화(Normalizing) : 신경망이 적절한 가중치를 학습할 수 있지만, 학습을 빠르게 해주고, 극소값(local optimum)에 빠질 위험을 줄여줌. ㆍkeras 모델 자동 검증 기능 : validation_data 이용 시 te.. [n413]Neural Training Options ■ Key words ㆍModel Architecture Selection; Arts, not science ㆍ학습 규제 전략(Regularization Strategies) ㆍWeight Regularization(가중치 규제) : L1, L2 regularization / Drop out ㆍWeight Constraints ㆍLearning Rate Decay / Scheduling ㆍ활성함수(Activation Function)별 trade-off ㆍ추가 활성화함수(Activation Functions) : Tanh Function / Leaky ReLU / Softmax ■ 주요내용 ㆍ가중치 초기화(Weight Initialization) : 학습 시작 시점의 가중치를 정해주는 것 - 모든 가중치.. [n412]경사하강법과 역전파 알고리즘 ■ Key words ㆍ경사하강법과 역전파(Backpropagation) 알고리즘 ㆍKeras Framework ㆍ비용(cost) / 손실(Loss) / 오차(error) 함수 ㆍEpoch / Batch / Iteration ■ 주요내용 ㆍ신경망 학습 알고리즘 : - 학습할 신경망 구조 선택 · 입력층 유닛의 수 = 특징 수 · 출력층 유닛의 수 = 타겟 클래스 수 · 은닉층 수, 각 은닉층의 노드 수 - 가중치 랜덤 초기화 - 순방향 전파를 통해 출력층 y값을 모든 입력값에 대해 계산 - 비용함수 계산 - 역방향 전파를 통해 편미분 값들 계산 - 경사하강법(or 다른 최적화 알고리즘)을 역전파와 함께 사용하여 비용함수 최소화 - 어떤 중지(stop) 기준을 충족하거나 비용함수를 최소화 할 때까지 2 ~.. [n411]Neural Network(NN) Foundation ■ Key words ㆍ신경망(Neural Network) / 인공신경망(Artificial Neural Network) ㆍPerceptron ㆍNeuron/Node ㆍActivation Function ㆍLayer ㆍBias ㆍIteration ■ 주요내용 ㆍPerceptron : 다수(두 개 이상)의 input을 받아 하나의 output을 출력하는 것 * perceptron의 예시 - AND GATE : 입력신호 모두 1이여야 1 - NAND GATE(Not AND) : 입력신호 모두 1일 경우에만 0 - OR GATE : 입력신호 중 하나라도 1이면 1 - XOR GATE : 입력신호가 모두 다를 떄에만(모두 0이거나 1인 경우 제외) 1; AND(OR, NAND) ㆍ신경망의 기본 구조 : 뇌의 실.. [n334]Deployment ■ Key words ㆍHeroku ㆍ배포 ㆍWSGI(Web Server Gateway Interface) ㆍ환경변수 ■ 주요내용 ㆍHeroku 배포 - WSGI : 웹서버와 웹 app.의 인터페이스를 위한 python의 framework. 다리 역할을 맡는 middleware. WSGI가 서버는 아니지만, 개발단계에서 test 할 수 있도록 일부 서버 기능을 포함함;gunicorn · gunicorn(green unicorn) : python의 WSGI HTTP Server. UNIX 체계에서 HTTP 요청을 처리함. - Heroku : 클라우드 플랫폼 서비스(Platform-as-a-service). 코드를 배포할 서버에 올리고 URL을 쉽게 얻을 수 있음. ⇒ AWS의 EC2를 기반으로 app. 배.. [n333]Flask(2/2) ■ Key words ㆍFlask-SQLAlchemy ㆍMigration ㆍFlask 구조 ■ 주요내용 ㆍApplication 구조 - Flask 뼈구조 · 프로젝트 구조 : config.py - 프로젝트에 대한 전반적인 설정 / flask_app - app 폴더를 독립 패키지로 관리 · Application 구조 : 한 개의 파일로 관리할 수도 있지만, 여러 개의 파일로 나누어 관리하기 위해서는 폴더로 만들고, __init__.py를 각 폴더에 넣어주어 폴더가 패키지로 인식되도록 한다. · __init__.py : Flask 어플리케이션 실행을 위한 초기 app 제공 · models.py : 모델 정보, 데이터베이스 기능 등을 담는 파일 · services : 어플리케이션에서 사용하는 서비스를 담는 파.. 이전 1 2 3 4 5 ··· 7 다음