Tuesday, December 5, 2017

11 mẹo đơn giản để tăng hiệu suất Java

 

Hầu hết các lập trình viên đều cho rằng việc optimize hiệu suất là một vấn đề phức tạp đòi hỏi nhiều kinh nghiệm và kiến thức. hẳn nhiên, điều đó không phải sai, bởi optimize một áp dụng để đạt được hiệu suất tốt nhất không phải là một nhiệm vụ dễ dàng. Nhưng điều đó không có tức là bạn không thể làm bất cứ điều gì nếu bạn không có những kiến thức đó. Dưới đây là một số gợi ý và bài tập tốt nhất giúp bạn tạo ra một ứng dụng hiệu quả.

Hầu hết các mẹo này đều dành cho Java. Nhưng cũng có một số language-independent (ngôn ngữ độc lập), mà bạn có thể vận dụng cho cả thảy các ứng dụng và tiếng nói lập trình. Chúng ta hãy nói về một số mẹo dành chung trước khi chúng ta đến các mẹo điều chỉnh hiệu suất của riêng Java.


1. Đừng Optimize khi nó không cấp thiết

Đó là một trong những mẹo điều chỉnh hiệu suất quan yếu nhất. Bạn nên làm theo các bước thường nhật một cách tốt nhất và thử test các trường hợp dùng. Nhưng điều đó không có nghĩa là bạn cần thay thế bất kỳ thư viện chuẩn nào hoặc xây dựng các bước optimize (tối ưu hoá) phức tạp trước khi bạn xác định được đó là điều cần thiết.

Trong Hầu hết các trường hợp, optimize sớm khiến tốn rất nhiều thời kì và làm cho code khó đọc và khó giữ nguyên. Và tệ hơn nữa, những hành động optimize này thường không mang lại bất kỳ lợi. nào vì bạn đang dành rất nhiều thời gian để optimize các phần không quan trọng của ứng dụng của bạn.

Vậy làm thế nào để xác định được bạn cần optimize cái gì?

trước nhất, bạn cần phải xác định vận dụng của mình chạy nhanh như thế nào, tỉ dụ bằng cách xác định thời gian phản hồi tối đa cho thảy các lệnh call API hoặc số lượng bản record bạn muốn nhập trong một khung thời kì nhất định. Sau khi bạn đã bước đó, bạn có thể tính hạnh được những phần nào trong vận dụng của bạn quá chậm và cần phải được cải thiện. Và khi bạn đã xác định được, bạn nên xem tiếp mẹo thứ 2.


2. sử dụng Profiler để tìm điểm kém hiệu quả thật sự

Sau khi bạn làm theo mẹo trước tiên và xác định được các phần của vận dụng cần cải tiến, hãy tự đặt câu hỏi phải bắt đầu từ đâu?

Bạn có thể tự giải quyết câu hỏi này theo hai cách:
Xem code của bạn và bắt đầu với những phần có vẻ đáng ngờ nhất hoặc điểm mà bạn cảm thấy nó có thể gây ra vấn đề.
Hoặc bạn dùng profiler và để nhận được thông báo chi tiết về dạng và hiệu suất của từng phần trong code.

Tôi nghĩ có lẽ không cần phải giải thích tại sao bạn nên chọn cách thứ hai.

Rõ ràng là phương pháp dựa vào profiler sẽ giúp bạn hiểu rõ hơn về hiệu suất của code và cho phép bạn tập hợp vào những phần quan trọng nhất. Và nếu bạn từng dùng một profiler, bạn sẽ nhớ một vài tình huống khiến bạn ngạc nhiên bởi những phần code đã tạo ra các vấn đề về hiệu suất.


3. Tạo một bộ test hiệu suất cho quờ quạng vận dụng

Đây là một mẹo chung giúp bạn tránh được rất nhiều sự cố không mong muốn, thường xảy ra sau khi bạn đã khai triển bước cải tiến hiệu suất trong sinh sản. Bạn cần có một bộ test hiệu suất để rà soát tất vận dụng, chạy nó trước và sau khi bạn cải tiến hiệu suất để so sánh.

Những lần test bổ sung này sẽ giúp bạn xác định các chức năng và hiệu suất đã thay đổi thế nào và đảm bảo rằng bạn không tung ra bản cập nhật làm hại đến áp dụng. Điều này đặc biệt quan yếu nếu bạn làm việc trên các component được dùng bởi một số phần khác nhau của vận dụng, như cơ sở dữ liệu hoặc caches.


4. Xử lý những nút thắt lớn nhất đầu tiên

Và sau khi bạn đã tạo bộ test và phân tích áp dụng của bạn với một profiler, bạn sẽ có một danh sách các vấn đề bạn muốn giải quyết để cải thiện hiệu suất. Điều đó tốt, nhưng nó vẫn không giúp đáp được câu hỏi rằng nên bắt đầu từ đâu. Bạn có thể tụ tập vào quick win (những điểm cần xử lý mau chóng) hoặc bắt đầu với một vấn đề quan yếu nhất.

Có thể bắt đầu với quick win vì chưng bạn sẽ sớm có thể nhận được những kết quả trước hết. Đôi khi, điều này có thể cấp thiết để thuyết phục các thành viên khác trong nhóm hoặc quản lý của bạn rằng việc phân tách hiệu suất là quan trọng.

Nhưng xét chung, tôi khuyên bạn nên bắt đầu từ đầu và đánh vào những vấn đề ảnh hưởng đến hiệu suất đáng kể nhất đầu tiên. Điều đó sẽ giúp bạn cải tiến hiệu suất tốt nhất và bạn có thể không cần phải sửa nhiều mà chỉ cần sửa những vấn đề này để đạt được hiệu suất mong muốn.

4 mẹo mới rồi là dành cho những vấn đề chung về hiệu suất. Chúng ta hãy cùng xem xét một số mẹo dành riêng cho Java nhé.


5. dùng StringBuilder để nối các String

Có rất nhiều phương thức để kết nối strings trong Java. Bạn có thể dùng những cách đơn giản như + hoặc +=, StringBuffer hoặc StringBuilder.

Vậy bạn thích cách tiếp cận nào nhất?

Câu trả lời tùy thuộc vào code bạn kết nối String. Nếu là thêm nội dung với for-loop thì bạn nên dùng StringBuilder bởi nó dễ dùng và cho hiệu năng tốt hơn StringBuffer. (Lưu ý rằng StringBuffer thì an toàn và hạp cho nhiều cảnh huống).

Bạn chỉ cần instantiate một StringBuilder và call append method để add phần mới vào String. Sau khi đã add mọi thứ thì bạn có thể call toString() method để lấy lại các String được kết nối. Code snippet sau đây cho ta thấy trong mỗi lần iteration, loop convert i thành một String và add chúng với một khoảng trống vào StringBuilder sb. Do đó, Code viết vào log file như sau: “This is a test0 1 2 3 4 5 6 7 8 9”:

Bạn có thể thấy trong code snippet, ta cung cấp nguyên tố trước tiên của String tới constructor method. Nó sẽ tạo ra StringBuilder mới chứa String được cung cấp kèm theo khoảng trống có thể thêm 16 kí tự nữa. Khi bạn add thêm kí tự vào StringBuilder, JVM sẽ ngay tức khắc tăng size của StringBuilder lên rất nhiều.

Còn nếu bạn đã biết có bao nhiêu kí tự trong String, bạn có thể giới hạn số lượng khoảng trống và nhờ đó tăng hiệu năng bởi nó không cần phải tự tăng sức chứa.


6. Dùng + để kết nối String trong một Statement

Khi bạn triển khai vận dụng trước hết trong Java, hẳn sẽ có ai đó nói với bạn rằng bạn không nên nối String bằng ‘+’. Và điều đó đúng nếu bạn đang nối String với application logic (các logic riêng cho một application cụ thể). Các String là không đổi thay và kết quả của mỗi String concatenation được lưu trong một String object mới. Điều đó đòi hỏi thêm memory và sẽ làm chậm ứng dụng của bạn, đặc biệt nếu bạn đang nối nhiều String trong một loop (vòng lặp).

Trong những trường hợp này, bạn nên làm theo mẹo số 5 và sử dụng một StringBuilder.

Nhưng đó không phải là lựa chọn nếu bạn đang muốn phá vỡ một String thành nhiều dòng để cải thiện tính dễ đọc của code.

Trong những trường hợp này, bạn nên nối String của mình với một ‘+’ đơn giản. Trình biên dịch Java của bạn sẽ optimize điều này và thực hiện các concatenation tại thời gian compile. thành ra, trong runtime, code của bạn sẽ chỉ sử dụng 1 String.


7. dùng Primitives ở điểm có thể

Một cách mau chóng và dễ dàng để tránh tổn phí nảy và cải thiện hiệu suất của áp dụng là sử dụng các kiểu primitive thay vì các class wrapper của chúng. nên, tốt hơn hết là dùng một int thay vì một Integer, hoặc một double thay vì một Double. Điều đó cho phép JVM của bạn lưu trữ value trong stack thay vì trong heap để giảm mức độ tiêu thụ memory và xử lý tổng thể hiệu quả hơn.


8. gắng tránh BigInteger và BigDecimal

Như chúng ta đã nói về các loại dữ liệu, chúng ta cũng nên xem nhanh BigInteger và BigDecimal. Đặc biệt là vì tính chính xác của nó. Nhưng cái gì cũng có giá của nó.

BigInteger và BigDecimal đề nghị memory nhiều hơn một long hoặc double đơn giản và làm chậm ắt các phép tính một cách đáng kể. Vì vậy, tốt hơn hãy nghĩ suy thật kỹ, nếu bạn cần tăng độ chuẩn xác hoặc nếu number của bạn vượt quá phạm vi của một long. Đây có thể là điều độc nhất vô nhị bạn cần phải đổi thay để khắc phục các vấn đề về hiệu suất, đặc biệt là nếu bạn đang thực hành một mathematical algorithm (thuật toán về toán học).


9. rà ở Current Log trước hết

Điều này là hiển nhiên, nhưng thật không may, bạn có thể thấy bây chừ có rất nhiều đoạn code bỏ qua nó. Trước khi tạo một thông báo debug, bạn nên xoành xoạch rà current log trước nhất. Nếu không, bạn có thể tạo một String mà log message sẽ bị bỏ qua.

Dưới đây là hai tỉ dụ về cách mà bạn KHÔNG nên làm.

Trong cả hai trường hợp này, bạn sẽ thực hiện quờ quạng các bước cần thiết để tạo ra log message mà không cần biết liệu logging framework của bạn có sử dụng log message hay không. Tốt hơn hết là rà chừng độ current log trước nhất, trước khi bạn tạo ra các tin nhắn debug.

10. sử dụng Apache thông thường StringUtils.Replace thay vì String.replace

Nói chung, method String.replace hoạt động tốt và hiệu quả khá cao, đặc biệt nếu bạn đang sử dụng Java 9. Nhưng nếu áp dụng của bạn đòi hỏi nhiều hoạt động replace và bạn chưa cập nhật phiên bản Java mới nhất, thì vẫn có các chọn lọc thay thế nhanh hơn và hiệu quả hơn.

Một ứng cử viên sáng giá là method StringUtils.replace của Apache Commons Lang. Như Lukas Eder thể hiện trong một trong các bài blog gần đây của họ, nó vượt trội hơn method String.replace của Java 8.

Và nó chỉ đòi hỏi ít sự thay đổi. Bạn cần phải thêm một Maven dependency vào project Commons Lang của Apache vào application pom.xml của bạn và thay thế tất thảy các lệnh call của method String.replace bằng method StringUtils.replace.


11. Lưu trữ resource lớn, như kết nối Database

Caching (bộ nhớ đệm) là một giải pháp phổ biến để tránh việc lặp lại các đoạn code “nặng” hoặc ngay được sử dụng. Ý tưởng chung đơn giản là: Tái dùng các resources như vậy sẽ đỡ tốn kém hơn so với việc tạo ra một cái mới hơn.

Một tỉ dụ tiêu biểu là lưu trữ các kết nối cơ sở dữ liệu trong một pool. Việc tạo ra một kết nối mới đòi hỏi nhiều thời gian, bạn có thể tránh được điều đó nếu bạn sử dụng lại một kết nối hiện có.

Bạn cũng có thể tìm các thí dụ khác bằng chính tiếng nói Java. Method valueOf của class Integer, tỉ dụ, lưu các value giữa -128 và 127. Bạn có thể cho rằng việc tạo ra một Integer mới không phải là quá tốn kém, nhưng nó thường sử dụng cách lưu trữ các giá trị được dùng nhiều nhất để đạt hiệu suất tối đa.

Nhưng khi bạn nghĩ về cache, hãy nhớ rằng việc thực hành cache cũng tiêu tốn resource. Bạn cần phải dành thêm memory để lưu trữ các resource tái dùng và bạn có thể cần phải quản lý bộ nhớ cache của mình để giúp cho các resource có thể truy cập được hoặc để xóa các resource lỗi thời.

nên, trước khi bạn bắt đầu bộ nhớ cache bất kỳ resource nào, hãy bảo đảm rằng bạn sử dụng chúng thường đủ để vượt quá phí tổn của việc khai triển bộ nhớ cache của bạn.
Tổng kết

Như bạn đã thấy, thỉnh thoảng không cần quá nhiều công sức để cải thiện hiệu suất vận dụng của bạn. Hầu hết các đề xuất trong bài này chỉ cần thêm một sự thế nhỏ là có thể ứng dụng chúng vào code của bạn.
 

  • Nhưng như thường nhật, những khuyến nghị quan trọng nhất vẫn là:
  • Không optimize trước khi bạn biết nó là cần thiết
  • dùng profiler để tìm ra nút thắt thực sự
  • Xử lý nút thắt lớn nhất trước hết

No comments:

Post a Comment