김기진
Backend Developer & AI Engineer
복잡한 문제를 단순화하고 IT 기술로 해결하는 것을 즐기는 개발자입니다. 대규모 트래픽 처리부터 AI 서비스 개발까지, 다양한 기술적 도전을 통해 실질적인 가치를 만들어내는 데 집중합니다.
About
저는 세상의 복잡한 문제를 IT 기술로 해결하며 보람과 행복을 느끼는 개발자 김기진입니다. 대규모 트래픽 처리와 RAG 기반 지능형 서비스 개발을 통해, 사람들에게 가치를 제공하는 소프트웨어를 만드는 데 집중해왔습니다. 최근에는 더 많은 문제를 해결할 수 있는 역량을 갖추기 위해 자연어 처리 기술을 학습하며 연구에 도전하고 있습니다.
Education
Experience
스크럼 진행, 코드 리뷰, API 설계, RDB/NoSQL 최적화 등 프로젝트 전반의 기술적 리딩과 팀 관리를 수행했습니다.
- DAU 40만 규모의 대용량 트래픽을 처리하는 채팅 서버 설계 및 개발
- Artillery 기반 부하 테스트로 메시지 처리 안정성 검증
- 읽음 처리, 1대1/단체/채널 채팅(500만명 이상 동시 발송) 기능 개발
- Node.js, Nest.JS 기반 API 및 Socket.io 실시간 통신 구현
- 멀티테넌트 아키텍처를 적용하여 시스템 확장성 확보
- MySQL, DynamoDB, Redis 설계 및 최적화로 성능 개선
- 북미/유럽 대상 글로벌 서비스의 백엔드 시스템 설계 및 개발
- 네트워크 지연 및 데이터 일관성을 고려한 안정적인 아키텍처 구축
- AWS 클라우드 환경(EC2, RDS, S3, SQS, Lambda) 기능 유지보수 및 운영
Projects
AI 기반 Slack Q&A 봇
팀 내부 지식(GitHub, Notion)에 대해 정확하고 근거 있는 답변을 제공하는 RAG 기반 Slack 봇
- LangGraph를 활용한 질문 분류 및 라우팅 워크플로우
- Gemini Embedding Model과 Pinecone 벡터 검색 시스템
- 주기적으로 GitHub/Notion 변경 사항 감지 및 임베딩 업데이트
- 멀티테넌시를 지원하는 DB 스키마와 로직 설계
RAG 파이프라인 최적화 실험
TopK, Chunk Size, Overlap 파라미터가 응답 품질과 비용에 미치는 영향을 정량적으로 분석
- 27개 파라미터 조합 × 21개 질문셋 × 3회 반복 실험
- RAGAS 프레임워크로 품질 지표 측정
- 품질-비용 최적 균형점(TopK=3, Chunk=512, Overlap=15%) 도출
- Answer Correctness 17%↑, Token 사용량 57%↓
AI/ML 학습 블로그
Transformer, CNN, ViT, U-Net, 패턴인식 이론 등 핵심 주제를 체계적으로 정리한 학습 블로그
- Transformer & Attention 메커니즘 정리
- CNN 계열: LeNet, AlexNet, VGG, ResNet, MobileNet
- Pattern Recognition: MLE, SVM, Gradient Descent
음식 이미지 칼로리 분석
YOLO 모델을 파인튜닝하여 음식 사진으로 칼로리와 영양 정보를 분석해주는 AI API 서버
- 90종 음식 데이터셋으로 YOLOv11 파인튜닝 (mAP 0.85)
- FastAPI 기반 실시간 이미지 처리 파이프라인
- AWS 클라우드 기반 확장 가능한 서버 인프라
AI 의류 재활용 플랫폼
YOLO 모델을 서빙하여 의류 재활용 선별 과정을 자동화하는 서비스
- 15개 카테고리 분류 및 결함 검출 API 개발
- TorchScript로 변환하여 추론 성능 최적화
- Docker Hub + AWS Elastic Beanstalk 자동 배포
헬스장 출석 동기부여 앱
헬스장 출석 및 소셜 기능을 갖춘 피트니스 웹/앱
- OpenRouter AI로 헬스장 이미지 검증 기능 구현
- Redis를 활용한 실시간 랭킹 및 레벨 시스템
- 소셜 기능을 통한 사용자 동기부여
Skills
Programming
AI / ML
Backend & DevOps
Research Interests
RAG & Domain-Specific LLM
RAG 기반 봇 구현 경험을 바탕으로, 외부 지식 베이스를 활용해 LLM의 신뢰도를 높이고 환각 현상을 줄이는 연구에 관심을 두고 있으며, 특히 도메인 특화 데이터에 대한 효율적인 검색, 인덱싱, 생성 전략을 탐구하고 있습니다.
LLM Serving & Inference Optimization
LLM 추론 과정에서 발생하는 병목과 처리량 한계를 주요 문제로 인식하고, 추론 파이프라인과 서빙 구조에서의 최적화 문제를 탐구 중입니다.