팀 프로젝트/개인정보 비식별처리 (2023한이음) 2

[23_HF054] 비식별처리 프로젝트 KPT 회고

*KEEP 처음으로 AWS를 사용하여 프로젝트를 구현하게 되어 처음에는 상당히 어려움이 있었지만 그래도 포기하지 않고 계속 노력하여 알아갔던 게 좋았던 것 같다. 새롭게 배워야 할 내용들이 많은데 계속 도전하려는 마음을 가지고 해야겠다. 이 프로젝트에서 사용한 AWS의 서비스(SQS, Lambda, S3, EC2)에 관한 내용들을 정리하여 추후 다른 프로젝트를 할 때도 다양한 에러들에 대처하고 구현에 필요한 서비스를 찾을 수 있도록 해야겠다. 이번 프로젝트를 진행하면서 문서 작업의 중요성을 알게 되었다. 특히 일정 관리와 추구하는 목표 역할 나눔에 있어서 잘 만들어진 문서 작업은 큰 도움을 줄 수 있다는 것을 느꼈다. *좋은 문서를 만드는 게 개인적으로는 가장 어려웠던 것 같다. 학교에서 했던 팀 프로젝..

[한이음23_HF054] 프로젝트 요약

GitHub 링크: https://github.com/kyounghunJang/23_HF054-De-identification 1. 프로젝트 소개 의료데이터의 분석 및 활용이 서비스 품질 발전에 큰 기여를 할 수 있는 상황이다. 하지만 이를 활용하기 위해서는 의료데이터에 포함된 개인정보를 제거해야한다. 따라서 비정형 데이터에서 개인정보를 추출 및 제거하는 기술을 개발하고 이를 활용한 자동화 파이프라인을 구축해보려고 한다. 2. 적용기술 및 아키텍처 비식별 처리 : 데이터 마스킹, 데이터 삭제 기술을 사용하여 민감한 개인정보를 비식별처리 비식별 처리 자동화 파이프라인 : 병원 서버를 S3로 가정하고 데이터가 업로드 되면 배치처리로 비식별처리 후 완료된 데이터를 DB에 저장하는 파이프라인 EasyOCR : ..