카테고리 없음

de-identification HIPPA identifiers

바모이 2022. 10. 27. 09:23

클린턴 행정부 시절인 1996년 미국 의회에서 통과된 HIPPA는 "건강보험 이전과 책임에 관한 법률"입니다.

이 법률에는 환자의 의료 정보를 열람할 수 있는 사람에 대한 규정이 명시되어 있습니다.

(HIPPA = Health Insurance Portability and Accountability Act)

 

The 18 HIPPA Identifiers

아래 18가지 식별자들은 환자 개개인을 식별할 수 있는 정보들입니다. (PHI = Protected Health Information)

: 이름, 주소, 날짜 정보들(생일, 입원일, 퇴원일, 예상수명 등), 전화번호, 팩스번호, 이메일, 주민등록번호, 진료기록번호, 건강보험번호, 계좌번호, 면허번호, 차량 식별자, 장치 식별자, 웹 주소(SNS 아이디 등), IP 주소, 지문, 사진(얼굴에 국한될 필요가 없습니다), 그 외 식별 가능한 정보

 

환자가 사망하더라도 사망일로부터 50년 동안 HIPPA 법안에 의해 개인정보가 보호됩니다. 따라서 환자의 정보를 health data로 사용하려면 위의 18가지 정보들을 제거해야 합니다.

 

 

Use Deep Learning

https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-020-1026-2

 

Customization scenarios for de-identification of clinical notes - BMC Medical Informatics and Decision Making

Background Automated machine-learning systems are able to de-identify electronic medical records, including free-text clinical notes. Use of such systems would greatly boost the amount of data available to researchers, yet their deployment has been limited

bmcmedinformdecismak.biomedcentral.com

위 논문에서는 이 문제를 Named Entity Recognition task로 접근하여 health data에서 HIPPA identifiers를 제거하려 합니다.

 

https://github.com/mounKim/redaction_hippa

 

GitHub - mounKim/redaction_hippa

Contribute to mounKim/redaction_hippa development by creating an account on GitHub.

github.com