CHULALONGKORN UNIVERSITY TECHNOLOGY CENTER
  • About
  • Our Portfolio
  • MedVentures
  • AI Academy
  • AI Services/Servers
  • FEDERATED LEARNING
  • PAST WORKSHOPS/SEMINARS
  • PRESS
  • Articles
  • Contact
Picture
Picture
FL Projects in Chula
A large amount of data is required to build a robust deep learning model that is accurate, while reducing the impact from noises and variances in the training data. In the medical domain, where data around certain types of diseases may be scarce, pooling data from multiple hospitals is absolutely essential to develop the best deep learning model, whi​le keeping patient information protected and private. Chulalongkorn University, through the Chulalongkorn University Technology Center (UTC), has established a strategic partnership with NVIDIA. The university is using NVIDIA's DGX-A100 and Clara Software/SDK to develop federated learning models from Nvidia NGC to drive deep tech and AI innovations in diverse domains including medicine and health.

WHAT IS FEDERATED LEARNING (FL)?

FL offers a promising solution to the data privacy issue since the system aggregates only deep learning model’s weights, not the actual data, from participating servers in order to improve the performance of a single global model. Hence, no patient data is ever transmitted outside of each hospital. By utilizing UTC's latest world-class AI infrastructure, NVIDIA's DGX-A100, our medical AI developer community can develop high performance AI models in short periods of time and deploy them in King Chulalongkorn Memorial Hospital to improve patients' quality of life.

To take part in an FL project, each participating site needs to set up a small-scale server with a graphical processing unit (GPU) – a typical requirement for any deep learning project, which will receive the deep learning model specification from the global server, train the model using the local dataset, and then send the updated model’s weights back to the global server. This process repeats in a round-robin style through all participating sites until the global model is fully optimized.

การประยุกต์ใช้เทคนิคการเรียนรู้เชิงลึกเพื่อค้นหาความสัมพันธ์ระหว่างข้อมูล input และข้อมูล output โดยลดผลกระทบจากส่วนของข้อมูลที่เป็นสัญญาณรบกวนและความแปรปรวนภายในข้อมูลนั้น จะต้องอาศัยข้อมูลเป็นปริมาณมาก และเนื่องจากสถาบันทางการแพทย์แต่ละแห่งมักจะไม่สามารถรวบรวมข้อมูลของผู้ป่วยได้เป็นปริมาณมากเพียงพอด้วยข้อจำกัดหลาย ๆ ประการ ทำให้การแบ่งปันข้อมูลจากหลากสถาบันกลายเป็นทางออกที่จำเป็นในการพัฒนาโมเดลทางการเรียนรู้เชิงลึกที่มีประสิทธิภาพเพื่อประยุกต์ใช้ทางการแพทย์ แต่อย่างไรก็ตาม การแบ่งปันข้อมูลผู้ป่วยข้ามสถาบันก็ยังต้องคำนึงถึงความปลอดภัยและความเป็นส่วนตัวของข้อมูลอีกด้วย จุฬาลงกรณ์มหาวิทยาลัย ผ่านศูนย์วิจัยและพัฒนาเทคโนโลยีเพื่ออุตสาหกรรม (UTC) ได้สร้างความร่วมมือเชิงยุทธศาสตร์กับบริษัท NVIDIA ผู้ผลิตอุปกรณ์คอมพิวเตอร์สำหรับพัฒนาปัญญาประดิษฐ์ชั้นแนวหน้าของโลก เพื่อที่จะผลักดันนวัตกรรมเทคโนโลยีชั้นสูงด้านปัญญาประดิษฐ์ในหลากหลายโดเมน โดยเฉพาะทางการแพทย์และสุขภาพ

หนึ่งในเทคโนโลยีที่จะมามีบทบาทในการแบ่งปันข้อมูลจากหลายสถาบันเพื่อพัฒนาปัญญาประดิษฐ์คือ Federated Learning หรือ FL ที่เป็นส่วนหนึ่งของ Clara train SDK ที่ออกแบบโดย NVIDIA ซึ่งเทคโนโลยีนี้จะช่วยขจัดปัญหาเรื่องการรักษาความปลอดภัยและความเป็นส่วนตัวของข้อมูลผู้ป่วย เพราะว่าการพัฒนาปัญญาประดิษฐ์ร่วมกันหลากสถาบันผ่านระบบ FL นี้จะทำการแลกเปลี่ยนเฉพาะพารามิเตอร์ของแบบจำลองจากแต่ละสถาบันเพื่อปรับปรุงการทำงานของแบบจำลองหลัก ทำให้ข้อมูลผู้ป่วยยังคงถูกเก็บรักษาอยู่ภายในระบบคอมพิวเตอร์ของแต่ละสถาบันโดยไม่มีการส่งออกมา ด้วยเครื่อง DGX-A100 ของ NVIDIA ซึ่งเป็นโครงสร้างพื้นฐานปัญญาประดิษฐ์ระดับโลกอันล่าสุดของ UTC นักพัฒนาปัญญาประดิษฐ์ทางการแพทย์ของเราสามารถพัฒนาแบบจำลองปัญญาประดิษฐ์ประสิทธิภาพสูงได้อย่างรวดเร็ว และนำไปใช้ในโรงพยาบาลจุฬาลงกรณ์เพื่อส่งเสริมคุณภาพชีวิตของผู้ป่วยให้ดีขึ้น
​
การจะเข้าร่วมโครงการพัฒนาปัญญาประดิษฐ์ผ่านระบบ FL นั้นไม่ยุ่งยากและไม่ได้อาศัยอุปกรณ์มากไปกว่าสิ่งที่ต้องใช้อยู่แล้วในการพัฒนาปัญญาประดิษฐ์ทั่วไป โดยสิ่งที่แต่ละสถาบันจะต้องทำคือการติดตั้งคอมพิวเตอร์ที่มีหน่วยประมวลผลกราฟิกส์ ซึ่งจะทำหน้าที่รับพารามิเตอร์ของแบบจำลองจากคอมพิวเตอร์แม่ข่ายกลางของโครงการ เพื่อนำมาทำการเรียนรู้บนข้อมูลของสถาบันแล้วจึงส่งพารามิเตอร์ของแบบจำลองที่ผ่านการเรียนรู้เพิ่มเติมแล้วกลับไปยังคอมพิวเตอร์แม่ข่ายกลาง กระบวนการแลกเปลี่ยนพารามิเตอร์ของแบบจำลองระหว่างคอมพิวเตอร์แม่ข่ายกลางของโครงการและคอมพิวเตอร์ที่ติดตั้งอยู่ในแต่ละสถาบันจะดำเนินการผลัดเวียนกันไปจนกระทั่งแบบจำลองปัญญาประดิษฐ์หลักได้รับการปรับปรุงจนแล้วเสร็จ


Picture
Figure 1: Training process on federated learning server with 3 clients

​Federated Learning is initialized by using server-sided config files including ports, minimum and maximum clients, certificate keys, etc, to create the global model to be stored on the server. After that, the server runs a loop, waiting for clients' request, then sends the global model to the clients and waits for clients to send back weight updates, the server then aggregates them and updates the global model. A process then repeats for the number of rounds set in the server config file.

For the client-side, the client uses client configuration, which can be different among multiple clients, to initialize the client session and make a request to the server to get a token. After that, the client requests the global model from the server and performs local training with local data, and sends the weight updates back to the server. Clients can set a number of epochs for each local training round of Federated Learning and also how much of the weight updates to be sent back to the server for aggregation. Finally, the client requests the server for a new global model after the aggregation and repeat through the same process.
 
FL จะเริ่มต้นทำงานโดยการใช้ การกำหนดค่าจากไฟล์ข้อมูลจากฝั่ง Server ประกอบด้วย พอร์ต, จำนวนของ Client ที่เชื่อมต่อ (min และ max) และ certificate keys เป็นต้น เพื่อสร้างโมเดลต้นแบบกลาง (Global Model) ที่จะเก็บไว้ที่ Server (Nvidia Clara) โดยทุกครั้งที่ Server ทำงาน Server จะรอการร้องขอจาก Client ซึ่งคือโรงพยาบาล เพื่อ Server จะส่งโมเดลต้นแบบกลางให้ และรอ Client ส่งข้อมูล Weight กลับมา เพื่ออัพเดทเข้าไปในโมเดลกลาง ซึ่งขั้นตอนนี้จะทำงานวนไปหลายๆรอบตามข้อมูลไฟล์ที่กำหนดไว้บน Server 
​
ในส่วนของฝั่ง Client (โรงพยาบาล) เมื่อ Client ทำการกำหนดค่าที่จะใช้ต่างๆ ซึ่งจะมีความหลากหลายในแต่ละ Client ในขั้นต้น จะทำการร้องขอไปที่ Server เพื่อขอ Token Key จากนั้น Client จะทำการร้องขอโมเดลต้นแบบกลาง และจากนั้นเมื่อได้มา จะทำการเทรนนิ่งแบบ Local โดยใช้ข้อมูลที่เป็น Local Data ซึ่งในทีนี้หมายถึง ข้อมูลเดต้าจากโรงพยาบาลนั้นๆ และทำการส่งค่า Weight กลับไปที่ Server และ Clients สามารถที่จะเซ็ตจำนวนของ epoch ที่จะใช้ในการเทรนนิ่งแบบ Local และค่า Weight ก่อนจะส่งไปรวมที่ Server และ Client ยังสามารถที่จะร้องขอไปที่ Server เพื่อให้ส่งโมเดลต้นแบบกลางอันใหม่หลังจากอัพเดทมาได้   
Picture
Figure 2: Flowchart depicting the workflow of normal training routine

FEDERATED LEARNING PROJECTS IN CHULA


​1. AI MODEL THAT PREDICTS OXYGEN NEEDS IN COVID-19 PATIENTS

_______________________________________________________________________

​
จากการที่จุฬาฯเป็น NVIDIA AI Technology Center (NVAITC) นำไปสู่ความร่วมมือกันระหว่างคณะแพทย์ศาสตร์ จุฬาฯ ภาควิชาวิศวกรรมคอมพิวเตอร์ จุฬาฯ และ Chula UTC ทำให้เราเป็นส่วนหนึ่งของการทดลอง federated learning สำหรับการทำนายความต้องการระดับออกซิเจ็นสำหรับผู้ป่วยโควิต 19 ซึ่งเป็น cutting edge เทคโนโลยีด้าน AI และเป็นความร่วมมือระดับโลก ทั้ง Mass General Brigham, NVIDIA, รวมไปถึงหน่วยงานด้านการแพทย์ทั่วโลกอีก 20 แห่ง เป็นอีกก้าวขอความตั้งใจที่จุฬาฯจะพัฒนานวัตกรรม AI for Health
__________________________________________________________________________________________________________

To lend a helping hand, Chulalongkorn University has taken part in a global initiative called EXAM (EMR CXR AI Model) by researchers at NVIDIA and Mass General Brigham. This initiative aims to ultimately produce an AI model that predicts the likelihood a person entering the emergency room with COVID-19 symptoms will require supplemental oxygen, helping physicians determine the need for ICU placement and provide the appropriate level of patient care necessary.

A complication that comes with training AI models for medical purposes on such a large-scale is the sharing of confidential data. However, using a privacy-preserving technique called federated learning, researchers from Chulalongkorn University, along with 19 other hospitals from around the world, can train a local model using chest X-rays, patient vitals and lab values, and subsequently share only a subset of model weights back with the global model without any privacy breaches.

For the EXAM initiative, a group of Chulalongkorn University’s clinicians and faculty members at the Faculty of Medicine established a Chula COVID-19 consortium. The consortium aggregated COVID-19 patients’ medical records and chest X-ray images from various clinics at King Chulalongkorn Memorial Hospital into a single database. Collectively, a total contribution of 180 positive and 500 negative cases was provided by our university.

The entire process operated using an NVIDIA V100 GPU and CLARA SDK on a server hosted at the Faculty of Medicine, Chulalongkorn University. Our data preprocessing and AI model training on the NVIDIA Clara Federated Learning Framework was performed locally with online technical support from NVIDIA throughout the initiative.

We achieved a higher performing model (increased AUC of 0.1) from federated learning compared to the model trained using only our local dataset. Additionally, this improved model is also expected to be much more generalized across patient populations, preventing the problem of model overfitting. 

On a global scale, our contribution in this international collaboration helped lead to the production of a global model of .94 area under the curve within a mere two weeks, giving an outstanding prediction for the level of oxygen required by incoming patients.

Chulalongkorn University is proud to be one of the contributors in this worldwide initiative to help improve healthcare and quality of life, and continue to work with both national and international partners to solve the world’s greatest challenges. 

Picture

CHULALONGKORN
​UNIVERSITY TECHNOLOGY CENTER

Get in touch
Subscribe to Newsletter
Picture
​Copyright © 2020 Chulalongkorn University Technology Center
  • About
  • Our Portfolio
  • MedVentures
  • AI Academy
  • AI Services/Servers
  • FEDERATED LEARNING
  • PAST WORKSHOPS/SEMINARS
  • PRESS
  • Articles
  • Contact