de-identification HIPPA identifiers
클린턴 행정부 시절인 1996년 미국 의회에서 통과된 HIPPA는 "건강보험 이전과 책임에 관한 법률"입니다.
이 법률에는 환자의 의료 정보를 열람할 수 있는 사람에 대한 규정이 명시되어 있습니다.
(HIPPA = Health Insurance Portability and Accountability Act)
The 18 HIPPA Identifiers
아래 18가지 식별자들은 환자 개개인을 식별할 수 있는 정보들입니다. (PHI = Protected Health Information)
: 이름, 주소, 날짜 정보들(생일, 입원일, 퇴원일, 예상수명 등), 전화번호, 팩스번호, 이메일, 주민등록번호, 진료기록번호, 건강보험번호, 계좌번호, 면허번호, 차량 식별자, 장치 식별자, 웹 주소(SNS 아이디 등), IP 주소, 지문, 사진(얼굴에 국한될 필요가 없습니다), 그 외 식별 가능한 정보
환자가 사망하더라도 사망일로부터 50년 동안 HIPPA 법안에 의해 개인정보가 보호됩니다. 따라서 환자의 정보를 health data로 사용하려면 위의 18가지 정보들을 제거해야 합니다.
Use Deep Learning
https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-020-1026-2
Customization scenarios for de-identification of clinical notes - BMC Medical Informatics and Decision Making
Background Automated machine-learning systems are able to de-identify electronic medical records, including free-text clinical notes. Use of such systems would greatly boost the amount of data available to researchers, yet their deployment has been limited
bmcmedinformdecismak.biomedcentral.com
위 논문에서는 이 문제를 Named Entity Recognition task로 접근하여 health data에서 HIPPA identifiers를 제거하려 합니다.
https://github.com/mounKim/redaction_hippa
GitHub - mounKim/redaction_hippa
Contribute to mounKim/redaction_hippa development by creating an account on GitHub.
github.com