[텍스트 마이닝] PoS (Part of Speech) - Markov Model . 각 feature에서 다음 feature로 전이 될 확률 모델 . 근데 단어가 똑같은 개수로 들어오면 똑같은 확률로 나옴 - Hidden Markov Model . lexical generation probability 사용 => 관사, 명사 등 별로 현재 단어가 나올 확률을 계산 . 요거도 supervised learning WSD - 단어가 ambiguous 할 수 있음 - 두 의미 중 뭐를 골라야해? context를 보고 판단 [Term Feature 추출] 검색에서 Term Feature - bag of words (단어들을 다 bag에 집어 넣는다) - doc, term 간의 matrix를 정의하면 vector..
[Big Data Analysis] EDA - Garbage In Garbage Out 으로 쓰레기 데이터가 들어가면 쓰레기 데이터가 나옴 자료를 활용하기 전에 주요 통계량 요약하고 그래프를 통해 시각적으로 파악해본다. 이게 젤 중요 EDA 방법 - 기술통계, 시각화 [기술통계] Measures of Central Tendency (중심경향값, 대표값) - 분포의 중심을 찾음 - Mean, Median, Mode, Quartile Dispersion (산포도) - 분포의 퍼짐 정도 - Variance, Min, Max, Range, Standard Deviation, Standard Error, Coefficient... Distribution (분포도) - 분포의 모양 - Kurtosis (첨도) . ..
- Total
- Today
- Yesterday
- 스프링 시큐리티
- Java
- Spring
- 백준
- 스프링
- 비트코인
- 사토시 나가모토
- SpringBoot
- leetcode
- excel parsing
- 블록체인
- Nealford
- 알고리즘
- Redis
- Vue.js
- white paper
- DP
- Bruteforce
- 카르다노
- 암호화폐
- Bitcoin
- Blockchain
- vuejs
- architecture
- 아키텍처
- 동적계획법
- kubernetes
- gRPC
- k8s
- CARDANO
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |