본문 바로가기

실무3

데이터 분석 실무 중에 마주친 문제들(220420) 데이터 분석 실무 중 마주친 문제들을 정리하며 어떻게 풀었는지, 또 어떤 난관에 부딛혔는지 기록해 볼 예정이다. 입사해서 지금까지 괴롭힌 문제도 있고, 최근에 마주하고 있는 문제도 있다. 혼자 끙끙 싸매다가 포기할 뻔했지만 감사하게 함께 고민해주시는 분들이 생겨 같이 풀고 있는 있는 문제도 있다. 그 해결과정들을 기록해보며 하나씩 풀어나가길 바라는 마음으로 정리해 봐야겠다. 1. 상품명 오기입 식별하기 상황 : 같은 상품이지만 오탈자 등의 이유로 같은 상품으로 식별이 안되는 이슈 원인 : 여러 유통채널에서 판매되는 상품들의 경우 유통사별로 MD의 상품명 기입 방식이 다르거나 상품명 기입 체계가 다르기 때문에 미세한 상품명 차이가 존재 접근방법 : 편집거리(Levienstein Distance) 구해서 유.. 2021. 6. 15.
[SQL] SQLD 10일 독학 합격 후기 1. 시험 후기 불합격이라고 거의 확신한 시험이었는데 합격했다. 사실 SQLD 공부를 시작하기로 한 글에서 밝혔듯이 후기나 교재를 보고나서 시간과 지식이 그렇게까지 많이 필요한 시험이 아니라고 판단했고, 그에 맞게 적당히만 공부했다. 하지만 시험장에서 느낀 느낌은 "아 이렇게 공부하는게 아니었구나.." 풀면서도 이게 맞나 싶은 문제가 1/3을 넘겼고, 아예 커버하지 못한 문제들도 꽤나 나왔다. 그리고.. 주관식 유형이 있는시험인지 몰랐다. (시험지 받고 뒷 부분에 주관식이 있어서 아주 깜짝 놀랐다..) 당연히 주관식 대비를 안했으니 거의 1/3은 빈칸이었다. 더 이상 나아질 게 없다고 생각해 종료 30분 남겨놓고 먼저 제출하고 나왔다. 나오면서 이 시험은 망했구나 싶었다. 시험장 나오자마자 다음 시험 일.. 2021. 4. 18.
PK와 FK PK 테이블을 생성할 때 PK를 정의한다. PK는 각 행을 고유하게 식별해주는 컬럼이다. 테이블당 하나만 정의 가능하다. NOT NULL + UNIQUE KEY값을 가짐 고유 인덱스가 자동으로 생성된다. 여기서 테이블당 하나만 정의 하다는 것을 이해할 때 PK가 여러 컬럼으로 구성될 수 있지만, PK값은 하나인 것으로 이해해야 한다. 예를 들어, 상품의 거래내역 테이블에서 PK값으로 상품코드와 판매코드를 키값으로(PK) 설정해 ROW를 식별하는 것과 같다. 만약 상품코드만 잡게 되면 동일 상품에 대해서 식별할 수 없고, 판매코드로 잡으면 같은 영수증에 판매건에 대해 식별할 수 없으니 두 값의 CONCAT값으로 키값을 잡는 것! FK 테이블을 생성할 때 FK를 정의한다. FK가 정의된 테이블이 자식 테이블.. 2021. 3. 4.